找到601个数据集

标签: 信息检索

过滤结果
  • 灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598

    2025年4月26日   

    灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598 数据来源:互联网公开数据 标签:灾难管理,问答系统,数据集,自然语言处理,机器学习,信息检索,灾害研究,应急响应 数据概述: 该数据集包含来自公开渠道的灾难相关信息,记录了与各类灾难相关的问答数据。主要特征如下:...
    packageimg
  • 论文摘要数据集PaperDTSDataset-nbviet

    2025年4月26日   

    论文摘要数据集PaperDTSDataset-nbviet 数据来源:互联网公开数据 标签:论文,摘要,数据集,文本分析,自然语言处理,机器学习,学术研究,信息检索 数据概述: 该数据集包含来自Paper DTS的数据,记录了论文的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围为不详。 地理范围:数据覆盖范围不详。...
    packageimg
  • 数据2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz

    2025年4月26日   

    2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz 数据来源:互联网公开数据 标签:事实核查,数据集,跨领域,机器学习,自然语言处理,文本分类,信息检索,可信度评估 数据概述: 该数据集源自2022年国际交叉语言评估会议(CLEF...
    packageimg
  • PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt

    2025年4月26日   

    PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt 数据来源:互联网公开数据 标签:PDF文件,知识提取,数据集,自然语言处理,机器学习,文本分析,信息检索,学术资源 数据概述:...
    packageimg
  • BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran

    2025年4月26日   

    BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,自然语言处理,机器学习,数据挖掘,信息检索,人工智能 数据概述:该数据集包含来自BBC(英国广播公司)的新闻文章,主要用于新闻类别的自动分类。主要特征如下:...
    packageimg
  • 新闻文章文本数据集-nikkummishra

    2025年4月26日   

    新闻文章文本数据集-nikkummishra 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,情感分析,信息检索,机器学习,舆情分析 数据概述: 该数据集包含来自多个来源的新闻文章文本数据,记录了各类新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为从特定年份至今。...
    packageimg
  • 生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar

    2025年4月26日   

    生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar 数据来源:互联网公开数据 标签:文档分类,自然语言处理,机器学习,数据集,环境研究,文本分析,生态旅游,信息检索 数据概述: 该数据集包含来自生态旅行领域的文档数据,记录了与生态旅游相关的各类文档的分类信息。主要特征如下:...
    packageimg
  • 新闻数据集Well-ShuffledNewsDataset-nushrathussain

    2025年4月26日   

    新闻数据集Well-ShuffledNewsDataset-nushrathussain 数据来源:互联网公开数据 标签:新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,数据分析,社会科学研究 数据概述: 该数据集包含来自多个来源的新闻文章,记录了不同类型和主题的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19

    2025年4月26日   

    金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19 数据来源:互联网公开数据 标签:金融问答,多跳推理,数据集,自然语言处理,机器学习,问答系统,金融分析,信息检索 数据概述:该数据集包含来自多个金融领域的问答数据,特别适用于需要多步推理的复杂金融问题解答。主要特征如下:...
    packageimg
  • 文本分类数据集TextClassificationData-nbviet

    2025年4月26日   

    文本分类数据集TextClassificationData-nbviet 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,主题建模,信息检索,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于具体来源。...
    packageimg
  • 垃圾邮件分类数据集SpamClassificationData-dkhalidashik

    2025年4月25日   

    垃圾邮件分类数据集SpamClassificationData-dkhalidashik 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,自然语言处理,机器学习,文本挖掘,邮件过滤,信息检索 数据概述: 该数据集包含用于垃圾邮件分类的文本数据,记录了大量邮件及其对应的标签,用于训练和评估垃圾邮件检测模型。主要特征如下:...
    packageimg
  • 自然语言处理任务问答数据集NewQAT5Dataset-hritik619916

    2025年4月25日   

    自然语言处理任务问答数据集NewQAT5Dataset-hritik619916 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,信息检索,深度学习,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,适用于自然语言处理领域的问答系统训练和研究。主要特征如下:...
    packageimg
  • 垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234

    2025年4月25日   

    垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,自然语言处理,文本挖掘,数据预处理,信息检索 数据概述: 该数据集包含来自互联网的电子邮件数据,用于垃圾邮件的分类研究。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集-habibmrad1983

    2025年4月25日   

    虚假新闻检测数据集-habibmrad1983 数据来源:互联网公开数据 标签:虚假新闻,自然语言处理,文本分类,机器学习,新闻分析,信息检索,数据集,社交媒体 数据概述:该数据集包含来自多个来源的虚假新闻和真实新闻数据,旨在用于虚假新闻的检测和分析。主要特征如下: 时间跨度:数据的时间跨度不固定,涵盖了不同时期的新闻文章。...
    packageimg
  • 罗马新闻文本数据集News-RomanDataset-zeshanali

    2025年4月25日   

    罗马新闻文本数据集News-RomanDataset-zeshanali 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,信息检索,文本分类,机器学习,意大利语 数据概述: 该数据集包含来自罗马地区新闻网站的文本数据,记录了各类新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 软件使用说明数据集SoftwareInstructionsDataset-omarayman67

    2025年4月25日   

    软件使用说明数据集SoftwareInstructionsDataset-omarayman67 数据来源:互联网公开数据 标签:软件使用说明,数据集,用户手册,技术支持,自然语言处理,机器翻译,信息检索,用户体验 数据概述: 该数据集包含了多种软件的使用说明和用户手册,适用于自然语言处理,机器翻译,信息检索等任务。主要特征如下:...
    packageimg
  • 泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit

    2025年4月25日   

    泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:...
    packageimg
  • 德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich

    2025年4月25日   

    德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich 数据来源:互联网公开数据 标签:电子邮件,数据集,XML格式,文本分析,邮件挖掘,自然语言处理,数据挖掘,信息检索 数据概述: 该数据集包含来自德国的电子邮件数据,记录了各类邮件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2010年。...
    packageimg
  • 文档摘要对数据集Document-AbstractPairsDataset-sark07

    2025年4月25日   

    文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,文本生成,机器翻译,信息检索,NLP 数据概述: 该数据集包含文档及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始文档的发布时间。...
    packageimg
  • 印度问答生物医学数据集HindiQnABiomedicalDataset-jaydee29

    2025年4月25日   

    印度问答生物医学数据集HindiQnABiomedicalDataset-jaydee29 数据来源:互联网公开数据 标签:生物医学,问答系统,自然语言处理,印地语,数据集,信息检索,医学,人工智能 数据概述: 该数据集包含来自印度问答系统的数据,主要聚焦于生物医学领域,旨在支持印地语的医学问答任务。主要特征如下:...
    packageimg