-
文本生成指令数据集TextGenerationInstructions-dmitriyab
文本生成指令数据集TextGenerationInstructions-dmitriyab 数据来源:互联网公开数据 标签:文本生成, 指令, 自然语言处理, 文本转换, 语言模型, 数据集, 创作, 语料库 数据概述: 该数据集包含用于文本生成的指令示例,记录了不同类型的文本生成任务。主要特征如下:... -
情绪分析上下文-回复数据集SentimentAnalysisContext-ResponseDataset-mostafataha12
情绪分析上下文-回复数据集SentimentAnalysisContext-ResponseDataset-mostafataha12 数据来源:互联网公开数据 标签:情感分析, 文本数据, 对话语料, 自然语言处理, 情绪识别, 心理健康, 语料库, 机器学习 数据概述: 该数据集包含来自公开来源的上下文-... -
文本分类多任务数据集TextClassificationMulti-taskDataset-sallymusanga
文本分类多任务数据集TextClassificationMulti-taskDataset-sallymusanga 数据来源:互联网公开数据 标签:文本分类, 多任务学习, 自然语言处理, 情感分析, 语义理解, 问答系统, 语料库, 数据集构建 数据概述: 该数据集包含多个文本分类任务的数据,记录了不同类型的文本分析和理解任务的示例。主要特征如下:... -
日常对话情感分析数据集DailyDialogueEmotionAnalysisDataset-yogeshwarsaini
日常对话情感分析数据集DailyDialogueEmotionAnalysisDataset-yogeshwarsaini 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 对话数据, 文本分类, 情绪识别, 机器学习, 语料库, 文本情感 数据概述: 该数据集包含来自日常对话的数据,记录了不同对话场景下人们的情感表达。主要特征如下:... -
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 文本分析, 语言学, 词汇, 语料库, 机器翻译 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,用于训练和评估孟加拉语词形还原模型。主要特征如下:... -
文本主题分类测试数据集TextTopicClassificationTestDataset-redoceanking
文本主题分类测试数据集TextTopicClassificationTestDataset-redoceanking 数据来源:互联网公开数据 标签:文本分类, 新闻主题, 自然语言处理, 机器学习, 语料库, Reuters, 文本分析, 情感分析 数据概述:... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-floridetuyisenge
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-floridetuyisenge 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 用户评论, 文本分析, 情感极性, 自然语言处理, 数据标注, 语料库 数据概述:... -
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 马达加斯加语, 语言学, 文本分析, 语料库, 机器学习, 语言模型 数据概述: 该数据集包含马达加斯加语的词性标注数据,记录了单词及其对应的词性标签。主要特征如下:... -
新闻文章标题内容分析数据集NewsArticleTitleandContentAnalysis-michapaliski
新闻文章标题内容分析数据集NewsArticleTitleandContentAnalysis-michapaliski 数据来源:互联网公开数据 标签:新闻文章, 标题分析, 内容摘要, 自然语言处理, 文本挖掘, 数据抓取, 语料库, 信息检索 数据概述: 该数据集包含来自Hacker... -
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-raulgdp
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-raulgdp 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 西班牙语, 语言学, 文本分析, 语料库, 标注数据, 机器学习 数据概述:... -
心理健康对话上下文数据集MentalHealthConversationContext-Response-poornimamarini
心理健康对话上下文数据集MentalHealthConversationContext-Response-poornimamarini 数据来源:互联网公开数据 标签:心理健康, 对话分析, 情感分析, 文本生成, 自然语言处理, 情绪识别, 问答系统, 语料库 数据概述:... -
话题模型反馈与元数据分析数据集TopicModelFeedback-MetadataAnalysisDataset-galegale05
话题模型反馈与元数据分析数据集TopicModelFeedback-MetadataAnalysisDataset-galegale05 数据来源:互联网公开数据 标签:话题模型, 文本分析, 主题建模, 情感分析, 数据挖掘, 机器学习, 语料库, 知识图谱 数据概述:... -
越南语文本分类训练数据集VietnameseTextClassificationTrainingData-nguyenvt1993
越南语文本分类训练数据集VietnameseTextClassificationTrainingData-nguyenvt1993 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 越南语, 情感分析, 机器翻译, 语料库, 深度学习, 数据标注 数据概述:... -
反事实推理文本分类数据集CounterfactualReasoningTextClassificationDataset-shiv712
反事实推理文本分类数据集CounterfactualReasoningTextClassificationDataset-shiv712 数据来源:互联网公开数据 标签:反事实推理, 文本分类, 自然语言处理, 情感分析, 假设分析, 机器学习, 语料库, 条件语句 数据概述:... -
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien 数据来源:互联网公开数据 标签:机器翻译, 口语, 语言学, 文本翻译, 摩洛哥, 法语, 对比分析, 语料库 数据概述:... -
通用问答系统对话数据集GeneralQuestionAnsweringDialogueDataset-lolqwyt
通用问答系统对话数据集GeneralQuestionAnsweringDialogueDataset-lolqwyt 数据来源:互联网公开数据 标签:问答系统, 对话, 自然语言处理, 文本生成, 语料库, 机器学习, 对话理解, 知识检索 数据概述: 该数据集包含来自互联网的问答对话数据,记录了用户提出的问题以及系统的回答。主要特征如下:... -
孟加拉语文本纠错数据集BanglaTextCorrectionDataset-ajoydey00001
孟加拉语文本纠错数据集BanglaTextCorrectionDataset-ajoydey00001 数据来源:互联网公开数据 标签:文本纠错, 孟加拉语, 自然语言处理, 语言学, 错误检测, 数据清洗, 机器学习, 语料库 数据概述: 该数据集包含孟加拉语文本的纠错示例,记录了原始(错误)文本及其对应的正确文本。主要特征如下:... -
情感分析文本数据集SentimentAnalysisTextDataset-lucamongelli
情感分析文本数据集SentimentAnalysisTextDataset-lucamongelli 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情感极性, 自然语言处理, 机器学习, 语料库, 文本数据, 数据标注 数据概述: 该数据集包含来自多个平台(包括Jira、Github和Stack... -
土耳其语历史人物问答数据集TurkishHistoricalFiguresQuestion-AnswerDataset-rhythmnarula
土耳其语历史人物问答数据集TurkishHistoricalFiguresQuestion-AnswerDataset-rhythmnarula 数据来源:互联网公开数据 标签:土耳其语, 历史人物, 问答系统, 自然语言处理, 文本摘要, 知识图谱, 信息检索, 语料库 数据概述:... -
古腾堡语料库词向量空间可视化数据集GutenbergCorpusWordVectorSpaceVisualizationDataset-palaksood97
古腾堡语料库词向量空间可视化数据集GutenbergCorpusWordVectorSpaceVisualizationDataset-palaksood97 数据来源:互联网公开数据 标签:词向量, 文本分析, 自然语言处理, 语料库, 可视化, 降维, 词嵌入, 古腾堡项目 数据概述: 该数据集包含基于古腾堡项目(Project...