-
新闻摘要生成数据集Mediasum-49999Dataset-gautamil
新闻摘要生成数据集Mediasum-49999Dataset-gautamil 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,新闻报道,深度学习,文本生成,语言模型 数据概述: 该数据集包含来自多个新闻来源的文章及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个时间段的新闻报道。... -
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600 数据来源:互联网公开数据 标签:文本摘要, 机器翻译, 印地语, 英语, 自然语言处理, 跨语言, 摘要生成, 文本分析 数据概述:... -
法律文本摘要生成效果评估数据集LegalTextSummarizationEvaluationDataset-veerchheda69
法律文本摘要生成效果评估数据集LegalTextSummarizationEvaluationDataset-veerchheda69 数据来源:互联网公开数据 标签:文本摘要, 法律文本, 评估, 自然语言处理, 机器翻译, Rouge, 摘要质量, 文本分析 数据概述:... -
中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11
中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学习, 双语对照, 自然语言处理, 语料库, 语言模型, 文本分析 数据概述: 该数据集包含中英双语短句,记录了英语短语及其对应的中文翻译。主要特征如下:... -
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25 数据来源:互联网公开数据 标签:文本嵌入, 语义分析, 自然语言处理, 深度学习, 向量空间, 语料库, 数据预处理, 机器翻译 数据概述: 该数据集包含经过处理的文本语料库数据及其对应的嵌入向量表示。主要特征如下:... -
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni 数据来源:互联网公开数据 标签:文本分类, 情感分析, 冒犯性语言, 仇恨言论, 语言学, 自然语言处理, 机器翻译, 语料库 数据概述:... -
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi 数据来源:互联网公开数据 标签:孟加拉语, 文本转换, 语言模型, 机器翻译, 自然语言处理, 数据集, 文本分析, 句子生成 数据概述:... -
Transformer初始模型子集数据集-tatsumicrub
Transformer初始模型子集数据集-tatsumicrub 数据来源:互联网公开数据 标签:Transformer,自然语言处理,数据集,模型训练,文本生成,机器翻译,语言模型,深度学习 数据概述: 该数据集包含用于Transformer初始模型训练和评估的文本数据子集。主要特征如下:... -
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy 数据来源:互联网公开数据 标签:机器翻译, 语言学, 越南语, 高棉语, 语料库, 平行语料, 文本翻译, 自然语言处理 数据概述: 该数据集包含越南语和高棉语的平行文本,旨在为机器翻译、跨语言研究等任务提供支持。主要特征如下:... -
多语言数据集Multy-LangDatasets-embarkiomar
多语言数据集Multy-LangDatasets-embarkiomar 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分类,语言模型,人工智能,计算机科学 数据概述: 该数据集包含来自多个语言的数据,记录了不同语言之间的文本对齐和文本分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,英语,希伯来语,自然语言处理,文本分析,翻译技术 数据概述: 该数据集包含来自OPUS项目的英语到希伯来语的平行文本数据,记录了大量的英文原文及其对应的希伯来文翻译。主要特征如下:... -
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-hasanalay
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-hasanalay 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 科技新闻, 自然语言处理, 机器学习, 文本分析, 语料库, 机器翻译 数据概述: 该数据集包含来自土耳其语科技新闻网站的文章数据,记录了科技领域的新闻文章内容。主要特征如下:... -
柬埔寨政治新闻摘要数据集CambodianPoliticalNewsSummaryDataset-sandeep16064
柬埔寨政治新闻摘要数据集CambodianPoliticalNewsSummaryDataset-sandeep16064 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 政治新闻, 柬埔寨, 自然语言处理, 文本分析, 语料库, 机器翻译 数据概述: 该数据集包含来自互联网的柬埔寨政治新闻文章及其对应的摘要。主要特征如下:... -
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 问答系统, 孟加拉语, 对比学习, 文本生成, 语言模型, 数据集 数据概述: 该数据集包含用于训练和评估孟加拉语指令问答模型的结构化数据。主要特征如下:... -
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj 数据来源:互联网公开数据 标签:文本转换, 问答系统, 文本摘要, 语义分析, 文本生成, 自然语言处理, 数据清洗, 机器翻译 数据概述:... -
新闻标题生成与用户行为分析数据集NewsHeadlineGenerationandUserBehaviorAnalysis-envy2002
新闻标题生成与用户行为分析数据集NewsHeadlineGenerationandUserBehaviorAnalysis-envy2002 数据来源:互联网公开数据 标签:新闻推荐, 标题生成, 用户行为, 自然语言处理, 文本摘要, 数据挖掘, 机器翻译, 内容推荐 数据概述:... -
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:... -
语义相似度文本对数据集SemanticSimilarityTextPairDataset-krishna21058
语义相似度文本对数据集SemanticSimilarityTextPairDataset-krishna21058 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 自然语言处理, 文本对, 机器翻译, 深度学习, 语料库, 数据集 数据概述: 该数据集包含来自公开渠道的文本对数据,记录了句子对之间的语义相似度评分。主要特征如下:... -
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung 数据来源:互联网公开数据 标签:机器翻译, 尼泊尔语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 数据集 数据概述: 该数据集包含来自多种来源的尼泊尔语-... -
移动应用用户反馈情感分析数据集MobileAppUserFeedbackSentimentAnalysis-mohamedaminetoumi
移动应用用户反馈情感分析数据集MobileAppUserFeedbackSentimentAnalysis-mohamedaminetoumi 数据来源:互联网公开数据 标签:情感分析, 用户反馈, 文本分类, 应用评价, 自然语言处理, 机器翻译, 数据标注, 产品优化 数据概述:...