找到600个数据集

标签: 信息检索

过滤结果
  • 跨编码器数据集Cross-EncoderDataset-epsilon12345

    2025年5月28日   

    跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:...
    packageimg
  • DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99

    2025年5月28日   

    DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation...
    packageimg
  • 强研实体链接数据集QiangyanEntityLinkingDataset-kejiewang

    2025年5月28日   

    强研实体链接数据集QiangyanEntityLinkingDataset-kejiewang 数据来源:互联网公开数据 标签:实体链接,自然语言处理,数据集,知识图谱,机器学习,语义理解,信息检索,数据挖掘 数据概述: 该数据集由强研项目提供,专注于实体链接任务,记录了文本中的实体与知识图谱中实体的对应关系。主要特征如下:...
    packageimg
  • 知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena

    2025年5月28日   

    知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 文本摘要, 自然语言处理, 数据清洗, 文本分析, 数据库, 信息检索 数据概述:...
    packageimg
  • 关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999

    2025年5月28日   

    关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword...
    packageimg
  • 垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk

    2025年5月28日   

    垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk 数据来源:互联网公开数据 标签:垃圾信息过滤,Quora问答,文本分类,自然语言处理,机器学习,数据挖掘,信息检索,网络安全 数据概述:...
    packageimg
  • 搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld

    2025年5月28日   

    搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld 数据来源:互联网公开数据 标签:搜索引擎,查询分析,数据集,自然语言处理,文本挖掘,信息检索,用户行为,数据科学 数据概述: 该数据集包含来自搜索引擎的预处理和分词后的查询数据,记录了用户输入的搜索查询信息。主要特征如下:...
    packageimg
  • 文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte

    2025年5月28日   

    文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte 数据来源:互联网公开数据 标签:文本挖掘,数据集,人工智能,自然语言处理,机器学习,文本分析,数据清洗,信息检索 数据概述:该数据集包含经过清理和预处理的文本数据,适用于文本挖掘和人工智能领域的研究和应用。主要特征如下:...
    packageimg
  • 法律文档检索与分类数据集ZaloAILegalRetrievalDataset-phandat12082002

    2025年5月28日   

    法律文档检索与分类数据集ZaloAILegalRetrievalDataset-phandat12082002 数据来源:互联网公开数据 标签:法律文档,数据集,信息检索,自然语言处理,文本分类,法律研究,机器学习,人工智能 数据概述:...
    packageimg
  • 法律文书问答数据集LegalDocumentQuestionAnsweringDataset-lthnhtinostic

    2025年5月28日   

    法律文书问答数据集LegalDocumentQuestionAnsweringDataset-lthnhtinostic 数据来源:互联网公开数据 标签:问答系统, 法律文本, 信息检索, 自然语言处理, 文本理解, 知识库, 司法, 越南语 数据概述: 该数据集包含来自越南法律文书的问答对,记录了用户提出的问题及其对应的法律条文上下文。主要特征如下:...
    packageimg
  • 问答系统与自然语言处理数据集DatasetfromQuACandSQuAD1with3000RowsMore-pedromoya

    2025年5月28日   

    问答系统与自然语言处理数据集DatasetfromQuACandSQuAD1with3000RowsMore-pedromoya 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,深度学习,信息检索,人工智能 数据概述: 该数据集整合了QuAC和SQuAD...
    packageimg
  • arXiv多分类数据集arXivMulticlassDataset-mahdmedsuccour

    2025年5月28日   

    arXiv多分类数据集arXivMulticlassDataset-mahdmedsuccour 数据来源:互联网公开数据 标签:学术研究,机器学习,数据集,文本分类,自然语言处理,分类算法,学术论文,信息检索 数据概述: 该数据集来源于arXiv(预印本论文库),包含了大量学术论文的文本数据,旨在用于多分类任务。主要特征如下:...
    packageimg
  • 法律文书检索数据集-lthnhtinostic

    2025年5月28日   

    法律文书检索数据集-lthnhtinostic 数据来源:互联网公开数据 标签:法律,文书检索,文本分析,信息检索,自然语言处理,数据集,机器学习,法律科技 数据概述: 该数据集包含来自法律领域的公开法律文书,旨在用于法律文书的检索和分析。主要特征如下: 时间跨度: 数据记录的时间范围为不限,具体取决于数据来源的开放程度。 地理范围:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-sreechrn

    2025年5月28日   

    虚假新闻检测数据集FakeNewsDetectionDataset-sreechrn 数据来源:互联网公开数据 标签:虚假新闻,新闻检测,自然语言处理,机器学习,文本分类,深度学习,信息检索,文本分析 数据概述: 该数据集包含来自互联网的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:...
    packageimg
  • 新闻文章文本内容分析数据集NewsArticleTextContentAnalysis-illusionnnnnnnn

    2025年5月28日   

    新闻文章文本内容分析数据集NewsArticleTextContentAnalysis-illusionnnnnnnn 数据来源:互联网公开数据 标签:新闻文章, 文本内容, 自然语言处理, 文本摘要, 情感分析, 信息检索, 机器学习, 数据集 数据概述:...
    packageimg
  • 维基百科百科全书数据集WikipediaEncyclopediaDataset-jayaprakashpondy

    2025年5月28日   

    维基百科百科全书数据集WikipediaEncyclopediaDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:百科全书,数据集,文本分析,知识图谱,自然语言处理,机器学习,信息检索,语义分析 数据概述: 该数据集包含来自维基百科的百科全书数据,记录了维基百科收录的各类知识条目及其详细信息。主要特征如下:...
    packageimg
  • 越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree

    2025年5月28日   

    越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 语料库, 信息检索, 语言模型, 数据集 数据概述: 该数据集包含来自越南语问答系统的数据,记录了越南语问题及其对应的标识符。主要特征如下:...
    packageimg
  • 新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997

    2025年5月28日   

    新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997 数据来源:互联网公开数据 标签:新闻语料库,文本分类,信息检索,数据集,自然语言处理,机器学习,文本分析,相关性判断 数据概述: 该数据集包含来自新闻语料库(NF Corpus)的训练数据,记录了新闻文章及其与特定查询词的相关性判断。主要特征如下:...
    packageimg
  • 越南语问答数据集VietnameseQuestionAnsweringDataset-tunphmnguynanh

    2025年5月28日   

    越南语问答数据集VietnameseQuestionAnsweringDataset-tunphmnguynanh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 信息检索, 机器阅读理解, 语料库, 数据集 数据概述:...
    packageimg
  • 新闻推荐系统数据集NewsRecommendationDataset-mitul777

    2025年5月28日   

    新闻推荐系统数据集NewsRecommendationDataset-mitul777 数据来源:互联网公开数据 标签:新闻推荐,数据集,推荐系统,机器学习,自然语言处理,信息检索,用户体验,数据挖掘 数据概述: 该数据集专注于新闻推荐领域,记录了用户与新闻内容的交互行为,适用于新闻推荐系统的研究与开发。主要特征如下:...
    packageimg