-
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge 数据来源:互联网公开数据 标签:阿拉伯语,文本摘要,数据集,自然语言处理,机器学习,语言学,信息检索,翻译 数据概述: 该数据集包含来自多个来源的阿拉伯语文本数据,旨在用于文本摘要任务的评估和研究。主要特征如下:... -
BBC新闻与AI生成摘要数据集-2004至2005年-pldtien
BBC新闻与AI生成摘要数据集-2004至2005年-pldtien 数据来源:互联网公开数据 标签:BBC新闻,新闻摘要,AI生成,文本摘要,自然语言处理,机器学习,数据集,新闻分类 数据概述: 本数据集包含从2004年至2005年BBC新闻存档中收集的新闻文章,并附有由OpenAI GPT-3.5... -
黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung
黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本分析,信息提取,人工智能,数据挖掘 数据概述: 该数据集包含来自多个来源的文本摘要数据,记录了原始文本及其对应的摘要信息。主要特征如下:... -
气候新闻稿摘要数据集ClimatePressReleasesSummarizedDataset-zdickson
气候新闻稿摘要数据集ClimatePressReleasesSummarizedDataset-zdickson 数据来源:互联网公开数据 标签:气候变化,新闻稿,数据集,文本摘要,自然语言处理,机器学习,环境研究,数据挖掘 数据概述:... -
新闻内容与摘要生成数据集-2019年-kevintoms
新闻内容与摘要生成数据集-2019年-kevintoms 数据来源:互联网公开数据 标签:新闻,文本摘要,自然语言处理,NLP,机器学习,数据挖掘,实时数据 数据概述: 本数据集包含2019年1月份收集的新闻文章数据,旨在为文本摘要生成和分类问题提供支持。数据集包含两个主要字段: title:新闻标题,每条标题长度约为10-15字。... -
CommonLit英语文章摘要数据集-artisusxiren
CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:... -
论文摘要生成数据集PaperSummarizationDataset-mohammedserag
论文摘要生成数据集PaperSummarizationDataset-mohammedserag 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,信息提取,学术研究,深度学习,文本分析 数据概述: 该数据集包含来自学术文献和科技文章的论文摘要数据,记录了论文的原文与相应的摘要信息。主要特征如下:... -
对话摘要数据集SAMSUM-jainikkhil
对话摘要数据集SAMSUM-jainikkhil 数据来源:互联网公开数据 标签:对话摘要,文本摘要,自然语言处理,数据集,机器学习,语言模型,文本分析,信息检索 数据概述:该数据集包含来自社交媒体平台的对话摘要数据,记录了用户之间的对话及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知。... -
尼泊尔新闻网站新闻内容分类数据集
尼泊尔新闻网站新闻内容分类数据集 数据来源:互联网公开数据 标签:尼泊尔新闻,新闻分类,文本分析,自然语言处理,新闻内容,文本摘要,新闻生成,尼泊尔 数据概述:... -
-
英文小说文本数据集
英文小说文本数据集 数据来源:互联网公开数据 标签:英文小说,自然语言处理,NLP,文本分类,文本摘要,文学作品,预处理,内容过滤 数据概述: 本数据集包含一系列英文小说文本,适用于自然语言处理(NLP)任务,例如文本分类、文本摘要等。数据集基于Project... -
HiDoctor波斯语健康美容博客数据集
HiDoctor波斯语健康美容博客数据集 数据来源:互联网公开数据 标签:健康,美容,波斯语,NLP任务,博客文章,多标签分类,文本摘要,问答系统,实体识别 数据概述: 本数据集包含40,000篇来自Hi... -
-
高质量文本摘要与生成示例数据集
高质量文本摘要与生成示例数据集 数据来源:互联网公开数据 标签:文本摘要,生成模型,自然语言处理,NLP,数据训练,模型优化,高质量示例 数据概述: 本数据集包含15,000个高质量的文本摘要与生成示例,由GPT-3.5... -
古兰经语料库1963-2021
古兰经语料库1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,宗教文本,机器翻译,文本生成,文本摘要,宗教研究 数据概述: 本数据集收录了古兰经的完整文本,涵盖了从1963年至2021年的版本。数据包含了古兰经的每一条经文,以及相应的章节和节编号,为宗教研究、文本分析和自然语言处理提供了重要的基础材料。 数据用途概述:... -
多语言印地语NLP数据集
多语言印地语NLP数据集 数据来源:互联网公开数据 标签:印地语NLP,自然语言处理,机器翻译,情感分析,命名实体识别,文本摘要,语言理解,多语言文本,新闻文章,社交媒体,对话文本 数据概述:... -
-
RAG金融法律评估数据集
RAG金融法律评估数据集 数据来源:互联网公开数据 标签:RAG,金融,法律,检索增强生成,企业问答,技术评估,机器学习,文本摘要,数据趋势分析 数据概述: 本数据集由Huggingface... -
尼泊尔新闻文章文本分类与摘要数据集
尼泊尔新闻文章文本分类与摘要数据集 数据来源:互联网公开数据 标签:尼泊尔语,新闻文章,文本分类,文本摘要,自然语言处理,NLP,机器学习,文本数据 数据概述: 本数据集包含约7500篇尼泊尔语新闻文章,来源于多个尼泊尔新闻网站。数据集经过清洗,包含相对平衡的训练集和测试集,适用于训练和评估尼泊尔语文本分类模型和文本摘要模型。 数据用途概述:... -
自然语言处理研究论文数据集
自然语言处理研究论文数据集 数据来源:互联网公开数据 标签:自然语言处理,研究论文,文本摘要,文档分类,结构分析,文本总结,学术研究 数据概述:...