找到601个数据集

标签: 信息检索

过滤结果
  • 预训练标签数据集Pred-trainTagsDataset-ananyaajoshi

    2025年4月25日   

    预训练标签数据集Pred-trainTagsDataset-ananyaajoshi 数据来源:互联网公开数据 标签:预训练,标签,数据集,自然语言处理,文本分类,信息检索,机器学习,深度学习 数据概述: 该数据集包含了用于预训练的标签数据,旨在支持各种自然语言处理任务,例如文本分类,信息检索等。主要特征如下: 时间跨度:...
    packageimg
  • 知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry

    2025年4月25日   

    知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry 数据来源:互联网公开数据 标签:知识竞赛,问答数据,数据集,自然语言处理,文本挖掘,机器学习,教育技术,信息检索 数据概述: 该数据集包含来自知识竞赛节目《Jeopardy!》的问答数据,记录了节目中提出的各类问题及其对应的答案。主要特征如下:...
    packageimg
  • 跨领域开放域问答数据集COSMOSQADataset-sidop21

    2025年4月25日   

    跨领域开放域问答数据集COSMOSQADataset-sidop21 数据来源:互联网公开数据 标签:开放域问答,自然语言处理,数据集,机器学习,对话系统,信息检索,文本理解,知识图谱 数据概述: 该数据集包含来自COSMOS项目的开放域问答数据,记录了用户提出的各种问题及其对应的答案。主要特征如下:...
    packageimg
  • 阿拉伯语新闻分类数据集-essasartawi

    2025年4月25日   

    阿拉伯语新闻分类数据集-essasartawi 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,阿拉伯语处理,信息检索,文本挖掘 数据概述:该数据集包含来自阿拉伯语新闻媒体的新闻文章,旨在用于新闻分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 图卢维基百科数据转储2023年数据集-moreducks

    2025年4月25日   

    图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。...
    packageimg
  • 国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi

    2025年4月25日   

    国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi 数据来源:互联网公开数据 标签:论文引用,数据集,学术研究,文献计量学,网络分析,机器学习,自然语言处理,信息检索 数据概述:...
    packageimg
  • 内容推荐系统数据集Content-BasedRecommendationDataset-denizmac

    2025年4月25日   

    内容推荐系统数据集Content-BasedRecommendationDataset-denizmac 数据来源:互联网公开数据 标签:推荐系统,内容推荐,数据集,机器学习,用户行为,文本分析,信息检索,自然语言处理 数据概述:该数据集包含来自多个来源的用户内容互动数据,记录了用户与内容项之间的交互信息。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集-salonimourya

    2025年4月25日   

    电子邮件垃圾邮件检测数据集-salonimourya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,自然语言处理,机器学习,信息检索,数据挖掘 数据概述: 该数据集包含电子邮件数据,用于垃圾邮件检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了电子邮件产生的历史数据。...
    packageimg
  • 元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018

    2025年4月25日   

    元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018 数据来源:互联网公开数据 标签:数据管理,知识图谱,元数据,数据集,信息检索,机器学习,语义分析,数据处理 数据概述: 该数据集由Metzoo项目提供,专注于元数据管理和知识图谱构建任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。...
    packageimg
  • 有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

    2025年4月25日   

    有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:...
    packageimg
  • 文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava

    2025年4月25日   

    文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava 数据来源:互联网公开数据 标签:文档处理,数据集,文本分类,自然语言处理,机器学习,信息检索,文本分析,数据挖掘 数据概述: 该数据集包含经过过滤和分类的文档数据,记录了各类文档的文本内容和分类标签。主要特征如下: 时间跨度:...
    packageimg
  • 信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya

    2025年4月25日   

    信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya 数据来源:互联网公开数据 标签:信息检索,查询分析,数据集,搜索引擎,自然语言处理,数据挖掘,人工智能,机器学习 数据概述: 该数据集包含了来自多个搜索引擎和在线信息检索系统的用户查询数据,记录了用户在搜索过程中的查询语句及相关信息。主要特征如下:...
    packageimg
  • 虚假新闻识别数据集RealFakeNewsDataset-abdelrhamanfakhry

    2025年4月25日   

    虚假新闻识别数据集RealFakeNewsDataset-abdelrhamanfakhry 数据来源:互联网公开数据 标签:新闻,虚假信息,数据集,文本分析,自然语言处理,机器学习,舆情分析,信息检索 数据概述: 该数据集包含来自不同来源的新闻文章,旨在用于虚假新闻的检测和识别研究。主要特征如下:...
    packageimg
  • 数据2015至2023年卫报新闻链接数据集TheGuardianNewsLinksfrom2015to2023Dataset-kiet21042003

    2025年4月25日   

    2015至2023年卫报新闻链接数据集TheGuardianNewsLinksfrom2015to2023Dataset-kiet21042003 数据来源:互联网公开数据 标签:新闻媒体,数据集,时间序列,文本分析,机器学习,新闻研究,数据挖掘,信息检索 数据概述:...
    packageimg
  • 越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810

    2025年4月25日   

    越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810 数据来源:互联网公开数据 标签:数据集,抄袭检测,文本分析,自然语言处理,机器学习,学术诚信,信息检索,越南语 数据概述: 该数据集包含来自越南维基百科的文本数据,记录了用于抄袭检测的文本样本。主要特征如下:...
    packageimg
  • 麻省理工学院图书馆藏书信息数据集MITLibraryCollectionDataset-shtrausslearning

    2025年4月25日   

    麻省理工学院图书馆藏书信息数据集MITLibraryCollectionDataset-shtrausslearning 数据来源:互联网公开数据 标签:图书馆,藏书,数据集,文献计量学,学术研究,信息检索,知识管理,数据分析 数据概述:该数据集包含来自麻省理工学院(MIT)图书馆的藏书信息,记录了MIT图书馆馆藏的详细信息。主要特征如下:...
    packageimg
  • 谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla

    2025年4月25日   

    谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla 数据来源:互联网公开数据 标签:图书,搜索,数据集,自然语言处理,文本分析,信息检索,机器学习,学术研究 数据概述: 该数据集包含来自谷歌图书搜索的响应数据,记录了用户在谷歌图书上进行搜索后得到的图书信息。主要特征如下:...
    packageimg
  • 谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk

    2025年4月25日   

    谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk 数据来源:互联网公开数据 标签:搜索引擎,搜索行为,数据集,自然语言处理,用户行为分析,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自谷歌搜索的公开信息,记录了用户的搜索查询,搜索结果,以及相关的用户交互行为。主要特征如下:...
    packageimg
  • 新冠疫情相关文章数据集COVID-19RelatedArticlesDataset-parkyoona

    2025年4月25日   

    新冠疫情相关文章数据集COVID-19RelatedArticlesDataset-parkyoona 数据来源:互联网公开数据 标签:公共卫生,新冠疫情,数据集,文本分析,自然语言处理,疾病传播,信息检索,医学研究 数据概述: 该数据集包含来自互联网公开渠道的新冠疫情相关文章数据,记录了关于新冠疫情的各类报道,研究论文和新闻资讯。主要特征如下:...
    packageimg
  • 学术分析数据集AcademicAnalysisDataset-satyaprakashshukl

    2025年4月25日   

    学术分析数据集AcademicAnalysisDataset-satyaprakashshukl 数据来源:互联网公开数据 标签:学术研究,数据集,文本分析,机器学习,教育技术,信息检索,数据分析,学术资源 数据概述: 该数据集包含来自学术机构的研究数据,记录了学术领域的文献,论文和研究成果的详细信息。主要特征如下: 时间跨度:...
    packageimg