-
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 社交媒体, 语言学, 情感分析, 语料库 数据概述:... -
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:... -
教育领域学生写作文本分类数据集EducationStudentWritingTextClassificationDataset-rjraac2018
教育领域学生写作文本分类数据集EducationStudentWritingTextClassificationDataset-rjraac2018 数据来源:互联网公开数据 标签:文本分类, 学生写作, 教育, 自然语言处理, 情感分析, 写作质量, 语料库, 机器学习 数据概述:... -
新闻文本分类数据集NewsTextClassificationDataset-aryanverma07
新闻文本分类数据集NewsTextClassificationDataset-aryanverma07 数据来源:互联网公开数据 标签:文本分类, 新闻摘要, 机器学习, 自然语言处理, 深度学习, 情感分析, 语料库, 预训练模型 数据概述: 该数据集包含来自新闻报道的文本摘要,记录了不同类别的新闻内容,用于文本分类任务。主要特征如下:... -
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet 数据来源:互联网公开数据 标签:知识问答, 自然语言处理, 上下文理解, 文本分析, 多选题, 机器学习, 数据集, 语料库 数据概述:... -
文本转述数据集TextParaphrasingDataset-soumyasangamjha
文本转述数据集TextParaphrasingDataset-soumyasangamjha 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 机器翻译, 文本生成, 语义理解, 数据增强, 深度学习, 语料库 数据概述: 该数据集包含来自多个来源的文本转述对,记录了原始文本及其对应的转述版本,旨在用于训练和评估文本转述模型。主要特征如下:... -
情感分析多语言文本情绪数据集MultilingualTextEmotionAnalysisDataset-kuongan
情感分析多语言文本情绪数据集MultilingualTextEmotionAnalysisDataset-kuongan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 情绪识别, 情感词典, 机器学习, 自然语言处理, 语料库 数据概述:... -
语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley
语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley 数据来源:互联网公开数据 标签:语言学, 文本分析, 文本对比, 语料库, 罗马字母, 梵文, 文本挖掘, 机器学习 数据概述: 该数据集包含来自语言学研究领域的数据,记录了罗马字母转写梵文的文本。主要特征如下:... -
文本相似度判断数据集TextSimilarityJudgmentDataset-shaffaka
文本相似度判断数据集TextSimilarityJudgmentDataset-shaffaka 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 二分类, 语义分析, 数据集, 机器学习, 语料库 数据概述: 该数据集包含从多个来源收集的文本对,记录了用于判断文本对之间相似度的结构化示例。主要特征如下:... -
越南问答数据集VietnameseQuestionAnsweringDataset-khinguynphan
越南问答数据集VietnameseQuestionAnsweringDataset-khinguynphan 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本检索, 信息抽取, 越南语, 语料库, 机器阅读理解, 数据集 数据概述: 该数据集包含来自越南语语料库的问答对,旨在支持越南语问答系统的开发与研究。主要特征如下:... -
文本摘要语料库预处理数据集TextSummarizationCorpusPreprocessed-anandheeanand
文本摘要语料库预处理数据集TextSummarizationCorpusPreprocessed-anandheeanand 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语料库, 预处理, 文本分析, 词嵌入, 机器学习, 文本挖掘 数据概述: 该数据集包含经过预处理的文本数据,旨在为文本摘要任务提供训练素材。主要特征如下:... -
越南语文本分类数据集VietnameseTextClassificationDataset-mrcausallll
越南语文本分类数据集VietnameseTextClassificationDataset-mrcausallll 数据来源:互联网公开数据 标签:文本分类, 越南语, 自然语言处理, 语料库, 商业, 行政, 文本清洗, 机器学习 数据概述: 该数据集包含来自越南语文本的数据,记录了越南语文本及其对应的类别标签。主要特征如下:... -
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 俄语, 新闻分析, 机器翻译, 深度学习, 文本生成, 语料库 数据概述: 该数据集包含来自新闻文章的数据,记录了俄语新闻文章的标题、原文文本及其生成的摘要。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-pulkittarora
电影评论情感分析数据集MovieReviewSentimentAnalysis-pulkittarora 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-davideaguglia
电影评论情感分析数据集MovieReviewSentimentAnalysis-davideaguglia 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 自然语言处理, 电影评论, 情感分类, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含电影评论数据,记录了观众对电影的情感反馈。主要特征如下:... -
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher 数据来源:互联网公开数据 标签:文本情感分析, 交通出行, 语料库, 情感分类, 机器学习, 自然语言处理, 交通政策, 环境保护 数据概述:... -
印地语-英语平行语料库数据集-harshityadavjnu
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。... -
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 自然语言处理, 机器学习, 文本分析, 创作质量, 论文写作, 语料库 数据概述:... -
孟加拉新闻文章文本分类数据集BanglaNewspaperArticleTextClassification-feyddautha
孟加拉新闻文章文本分类数据集BanglaNewspaperArticleTextClassification-feyddautha 数据来源:互联网公开数据 标签:文本分类, 新闻文章, 孟加拉语, 自然语言处理, 语料库, 情感分析, 标题分析, 深度学习 数据概述: 该数据集包含来自孟加拉国新闻媒体的文章数据,旨在用于文本分类任务。主要特征如下:... -
多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha
多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 多语言, 语音翻译, 机器学习, 语料库, 印度语言, 声学模型 数据概述:...