-
灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598
灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598 数据来源:互联网公开数据 标签:灾难管理,问答系统,数据集,自然语言处理,机器学习,信息检索,灾害研究,应急响应 数据概述: 该数据集包含来自公开渠道的灾难相关信息,记录了与各类灾难相关的问答数据。主要特征如下:... -
论文摘要数据集PaperDTSDataset-nbviet
论文摘要数据集PaperDTSDataset-nbviet 数据来源:互联网公开数据 标签:论文,摘要,数据集,文本分析,自然语言处理,机器学习,学术研究,信息检索 数据概述: 该数据集包含来自Paper DTS的数据,记录了论文的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围为不详。 地理范围:数据覆盖范围不详。... -
数据2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz
2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz 数据来源:互联网公开数据 标签:事实核查,数据集,跨领域,机器学习,自然语言处理,文本分类,信息检索,可信度评估 数据概述: 该数据集源自2022年国际交叉语言评估会议(CLEF... -
PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt
PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt 数据来源:互联网公开数据 标签:PDF文件,知识提取,数据集,自然语言处理,机器学习,文本分析,信息检索,学术资源 数据概述:... -
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,自然语言处理,机器学习,数据挖掘,信息检索,人工智能 数据概述:该数据集包含来自BBC(英国广播公司)的新闻文章,主要用于新闻类别的自动分类。主要特征如下:... -
新闻文章文本数据集-nikkummishra
新闻文章文本数据集-nikkummishra 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,情感分析,信息检索,机器学习,舆情分析 数据概述: 该数据集包含来自多个来源的新闻文章文本数据,记录了各类新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为从特定年份至今。... -
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar 数据来源:互联网公开数据 标签:文档分类,自然语言处理,机器学习,数据集,环境研究,文本分析,生态旅游,信息检索 数据概述: 该数据集包含来自生态旅行领域的文档数据,记录了与生态旅游相关的各类文档的分类信息。主要特征如下:... -
新闻数据集Well-ShuffledNewsDataset-nushrathussain
新闻数据集Well-ShuffledNewsDataset-nushrathussain 数据来源:互联网公开数据 标签:新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,数据分析,社会科学研究 数据概述: 该数据集包含来自多个来源的新闻文章,记录了不同类型和主题的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19
金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19 数据来源:互联网公开数据 标签:金融问答,多跳推理,数据集,自然语言处理,机器学习,问答系统,金融分析,信息检索 数据概述:该数据集包含来自多个金融领域的问答数据,特别适用于需要多步推理的复杂金融问题解答。主要特征如下:... -
文本分类数据集TextClassificationData-nbviet
文本分类数据集TextClassificationData-nbviet 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,主题建模,信息检索,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于具体来源。... -
垃圾邮件分类数据集SpamClassificationData-dkhalidashik
垃圾邮件分类数据集SpamClassificationData-dkhalidashik 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,自然语言处理,机器学习,文本挖掘,邮件过滤,信息检索 数据概述: 该数据集包含用于垃圾邮件分类的文本数据,记录了大量邮件及其对应的标签,用于训练和评估垃圾邮件检测模型。主要特征如下:... -
自然语言处理任务问答数据集NewQAT5Dataset-hritik619916
自然语言处理任务问答数据集NewQAT5Dataset-hritik619916 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,信息检索,深度学习,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,适用于自然语言处理领域的问答系统训练和研究。主要特征如下:... -
垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234
垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,自然语言处理,文本挖掘,数据预处理,信息检索 数据概述: 该数据集包含来自互联网的电子邮件数据,用于垃圾邮件的分类研究。主要特征如下:... -
虚假新闻检测数据集-habibmrad1983
虚假新闻检测数据集-habibmrad1983 数据来源:互联网公开数据 标签:虚假新闻,自然语言处理,文本分类,机器学习,新闻分析,信息检索,数据集,社交媒体 数据概述:该数据集包含来自多个来源的虚假新闻和真实新闻数据,旨在用于虚假新闻的检测和分析。主要特征如下: 时间跨度:数据的时间跨度不固定,涵盖了不同时期的新闻文章。... -
罗马新闻文本数据集News-RomanDataset-zeshanali
罗马新闻文本数据集News-RomanDataset-zeshanali 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,信息检索,文本分类,机器学习,意大利语 数据概述: 该数据集包含来自罗马地区新闻网站的文本数据,记录了各类新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
软件使用说明数据集SoftwareInstructionsDataset-omarayman67
软件使用说明数据集SoftwareInstructionsDataset-omarayman67 数据来源:互联网公开数据 标签:软件使用说明,数据集,用户手册,技术支持,自然语言处理,机器翻译,信息检索,用户体验 数据概述: 该数据集包含了多种软件的使用说明和用户手册,适用于自然语言处理,机器翻译,信息检索等任务。主要特征如下:... -
泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit
泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:... -
德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich
德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich 数据来源:互联网公开数据 标签:电子邮件,数据集,XML格式,文本分析,邮件挖掘,自然语言处理,数据挖掘,信息检索 数据概述: 该数据集包含来自德国的电子邮件数据,记录了各类邮件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2010年。... -
文档摘要对数据集Document-AbstractPairsDataset-sark07
文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,文本生成,机器翻译,信息检索,NLP 数据概述: 该数据集包含文档及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始文档的发布时间。... -
印度问答生物医学数据集HindiQnABiomedicalDataset-jaydee29
印度问答生物医学数据集HindiQnABiomedicalDataset-jaydee29 数据来源:互联网公开数据 标签:生物医学,问答系统,自然语言处理,印地语,数据集,信息检索,医学,人工智能 数据概述: 该数据集包含来自印度问答系统的数据,主要聚焦于生物医学领域,旨在支持印地语的医学问答任务。主要特征如下:...