-
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:... -
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 俄语, 新闻分析, 机器翻译, 深度学习, 文本生成, 语料库 数据概述: 该数据集包含来自新闻文章的数据,记录了俄语新闻文章的标题、原文文本及其生成的摘要。主要特征如下:... -
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:... -
印地语-英语平行语料库数据集-harshityadavjnu
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。... -
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation... -
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-bahodirmaydonov
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-bahodirmaydonov 数据来源:互联网公开数据 标签:文本分类, 新闻摘要, 科技新闻, 自然语言处理, 机器翻译, 情感分析, 数据标注, 乌兹别克语 数据概述:... -
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,语料库,越南语,苗语,语言学,自然语言处理,双语数据,文本数据 数据概述: 该数据集包含越南语和苗语的双语平行文本,旨在促进越南语和苗语之间的机器翻译研究。主要特征如下:... -
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:... -
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 语料库, 自然语言处理, 文本翻译, 文本分析, 印度语, 语言对 数据概述:... -
罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine
罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine 数据来源:互联网公开数据 标签:语言处理,泰卢固语,罗马化,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含罗马化泰卢固语文本数据,记录了泰卢固语词汇、短语或句子的罗马化转写。主要特征如下:... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 文本摘要, 语言模型, 数据集 数据概述: 该数据集包含来自阿拉伯语新闻文章及其对应的摘要。主要特征如下:... -
科技论文摘要生成数据集ScientificPaperAbstractGeneration-mridul3301
科技论文摘要生成数据集ScientificPaperAbstractGeneration-mridul3301 数据来源:互联网公开数据 标签:文本生成, 摘要, 自然语言处理, 机器翻译, 论文写作, 深度学习, 语料库, 学术研究 数据概述: 该数据集包含来自学术论文的数据,记录了论文原文与对应的摘要。主要特征如下:... -
文本摘要评估语句数据集TextSummarizationEvaluationSentences-terrychanorg
文本摘要评估语句数据集TextSummarizationEvaluationSentences-terrychanorg 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语句评估, 文本分析, 语篇理解, 机器翻译, 情感分析, 语料库 数据概述:... -
文本摘要生成俄语新闻数据集TextSummarizationRussianNewsDataset-nmaria
文本摘要生成俄语新闻数据集TextSummarizationRussianNewsDataset-nmaria 数据来源:互联网公开数据 标签:文本摘要, 俄语, 新闻, 自然语言处理, 机器翻译, 深度学习, 数据集, 文本生成 数据概述: 该数据集包含来自新闻媒体的俄语新闻文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:... -
越南语自然语言处理NLP数据集-minhhieuhuynh
越南语自然语言处理NLP数据集-minhhieuhuynh 数据来源:互联网公开数据 标签:自然语言处理,越南语,文本分析,机器翻译,情感分析,数据集,语言模型,文本挖掘 数据概述: 该数据集包含来自越南语文本的数据,用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体子数据集,可能涵盖多年。... -
新闻摘要生成文本数据集NewsSummarizationTextDataset-vansy08
新闻摘要生成文本数据集NewsSummarizationTextDataset-vansy08 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻分析, 文本生成, 深度学习, 机器翻译, 语料库, 数据集 数据概述: 该数据集包含来自新闻网站的文章及其对应的摘要,用于训练和评估文本摘要模型。主要特征如下:... -
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:... -
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,机器翻译,情感分析,语言模型,韩国语 数据概述: 该数据集包含来自世宗人工智能挑战赛的竞赛数据,主要涉及韩国语的文本处理任务。主要特征如下: 时间跨度:数据记录的时间范围为挑战赛期间。... -
新闻文章多语言情感分析数据集NewsArticlesMulti-languageSentimentAnalysis-osama39
新闻文章多语言情感分析数据集NewsArticlesMulti-languageSentimentAnalysis-osama39 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 新闻文章, 自然语言处理, 机器翻译, 数据集构建, 文本语料库 数据概述:... -
印度理工学院B0级印地语数据集IIT-B0HindiDataset-swapanroy
印度理工学院B0级印地语数据集IIT-B0HindiDataset-swapanroy 数据来源:互联网公开数据 标签:印地语,数据集,语言学习,自然语言处理,文本分析,机器翻译,语音识别,教育技术 数据概述: 该数据集由印度理工学院提供,主要记录了B0级别的印地语学习数据,适用于语言学习、自然语言处理等任务。主要特征如下:...