-
亚马逊评论字幕数据集ARC-SubsDataset-philipkd
亚马逊评论字幕数据集ARC-SubsDataset-philipkd 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,字幕,情感分析,机器翻译,评论,亚马逊 数据概述: 该数据集包含了来自亚马逊网站的商品评论以及对应的字幕数据,旨在为自然语言处理任务提供训练和评估资源。主要特征如下:...
-
文档摘要对数据集Document-AbstractPairsDataset-sark07
文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,文本生成,机器翻译,信息检索,NLP 数据概述: 该数据集包含文档及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始文档的发布时间。...
-
政府会议摘要数据集CivilsumRun1-GovernmentMeetingSummaryDataset-aadityaudayghaisas
政府会议摘要数据集CivilsumRun1-GovernmentMeetingSummaryDataset-aadityaudayghaisas 数据来源:互联网公开数据 标签:政府会议,摘要生成,数据集,自然语言处理,文本摘要,机器学习,会议记录,公共管理 数据概述:...
-
孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif
孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,机器翻译,数据集,深度学习,语言模型,机器学习,人工智能 数据概述: 该数据集专注于孟加拉语文本的摘要生成任务,记录了大量的孟加拉语文本及其对应的摘要。主要特征如下:...
-
摘要生成与格式化数据集SAMSUMSummaryFormattedasJSONwithQwen2-7bDataset-lcwsstg
摘要生成与格式化数据集SAMSUMSummaryFormattedasJSONwithQwen2-7bDataset-lcwsstg 数据来源:互联网公开数据 标签:自然语言处理,摘要生成,数据集,机器学习,文本处理,数据格式化,人工智能,语言模型 数据概述:...
-
文本摘要与主题分类数据集LCSTS数据集-yojn710
文本摘要与主题分类数据集LCSTS数据集-yojn710 数据来源:互联网公开数据 标签:文本摘要,主题分类,自然语言处理,机器学习,数据集,中文,深度学习,NLP 数据概述: 该数据集包含来自新浪微博的中文文本数据,主要用于文本摘要和主题分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但主要来源于社交媒体平台。...
-
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,阿拉伯语,深度学习,数据集,机器翻译,语言模型,NLP 数据概述: 该数据集包含大量阿拉伯语文本及其对应的摘要,旨在用于阿拉伯语文本摘要任务的研究与开发。主要特征如下:...
-
大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda
大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,大型语言模型,评估数据集,模型测评,文本生成,人工智能,学术研究 数据概述: 该数据集包含用于评估大型语言模型(LLM)总结能力的文本数据。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。...
-
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:...
-
文本摘要任务数据集FinalTextSummarizationDataset-devtousif
文本摘要任务数据集FinalTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,机器翻译,文本分析,人工智能,NLP 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在评估和训练文本摘要模型。主要特征如下:...
-
自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01
自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源:互联网公开数据 标签:自然语言处理,新闻标题,文本分析,机器学习,情感分析,文本摘要,数据集,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻标题数据,主要用于自然语言处理(NLP)相关的研究和应用。主要特征如下:...
-
文本摘要数据集TextSummarizationDataset-dngnguynanh12
文本摘要数据集TextSummarizationDataset-dngnguynanh12 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,NLP,文本分析,信息检索 数据概述: 该数据集包含大量文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:...
-
保加利亚文章关键词数据集
保加利亚文章关键词数据集 数据来源:互联网公开数据 标签:保加利亚文章,关键词提取,文本分析,自然语言处理,GPT预训练,文本摘要 数据概述: 本数据集包含一个CSV文件(kw-dataset.csv),记录了多篇保加利亚文章的标题、正文及其对应的关键词。每条数据包括以下字段: - title(文章标题):展示文章的核心主题。 -...
-
多模态文本摘要数据集MT-SummDataset-gsaichaitanya
多模态文本摘要数据集MT-SummDataset-gsaichaitanya 数据来源:互联网公开数据 标签:多模态数据,文本摘要,数据集,自然语言处理,深度学习,机器学习,多媒体分析,信息检索 数据概述: 该数据集包含来自多个来源的多模态文本摘要数据,记录了图像和相应文本的摘要信息。主要特征如下:...
-
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai 数据来源:互联网公开数据 标签:越南语,文本摘要,数据集,自然语言处理,NLP,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自越南新闻网站的文章及其对应的摘要。主要特征如下:...
-
提取摘要数据集ExtractAbstractDataset-potatohuhu
提取摘要数据集ExtractAbstractDataset-potatohuhu 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,深度学习,摘要生成,文本分析,人工智能 数据概述:该数据集包含从互联网上提取的文本及其对应的摘要信息,旨在用于文本摘要模型的训练和评估。主要特征如下:...
-
医疗领域医生病人对话总结数据集MainDoctorPatientSummarizationDataset-jerlshinjg
医疗领域医生病人对话总结数据集MainDoctorPatientSummarizationDataset-jerlshinjg 数据来源:互联网公开数据 标签:医疗健康,医生病人对话,数据集,自然语言处理,文本摘要,机器学习,医学研究,患者护理...
-
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564
文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。...
-
美国和加州立法提案摘要数据集-undersc0re
美国和加州立法提案摘要数据集-undersc0re 数据来源:互联网公开数据 标签:立法,提案,摘要,文本分析,自然语言处理,美国,加州,法律,文本长度 数据概述: 本数据集包含了美国联邦立法提案和加州立法提案的摘要信息,总计超过23000条记录。数据分为训练集(train)、加州测试集(ca_test)和测试集(test)三个部分。...
-
PDF文档摘要提取数据集DrivePDFDataset-atif10
PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。...



