-
水研究领域科学出版物信息检索测试集
2025年12月22日 30 184 141
数据集概述 该数据集包含水研究交叉领域的科学出版物信息检索测试集,分为ThWIC-Chemistry和ThWIC-Hierarchy两个子数据集。提供领域标签和属性标签,可用于衡量数据子集的主题多样性及属性代表性,为信息检索研究提供测试资源。 文件详解 文件名称:ThWIC_Datasets_description.pdf 文件格式:PDF...
-
新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997
2025年5月28日 30 105 104
新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997 数据来源:互联网公开数据 标签:新闻语料库,文本分类,信息检索,数据集,自然语言处理,机器学习,文本分析,相关性判断 数据概述: 该数据集包含来自新闻语料库(NF Corpus)的训练数据,记录了新闻文章及其与特定查询词的相关性判断。主要特征如下:...



