-
触及痛点20_论点提取_争议性问题数据集
2026年2月2日 30 163 10
数据集概述 本数据集为Touché 2020争议问题论点检索任务的数据,包含6个文件,涵盖任务主题、检索结果运行文件及相关性判断文件,支持自然语言处理领域中争议问题论点检索相关研究,文件类型以.zip和.qrels为主。 文件详解 主题文件 文件名称:topics-task-1.zip 文件格式:ZIP 字段映射介绍:包含Touché...
-
Touché23_Task2_因果问题证据检索任务数据
2026年1月31日 30 44 15
数据集概述 本数据集为Touché 2023会议因果问题证据检索任务的专用数据,包含任务所需的主题文件、相关性判断文件及结果压缩包,共5个文件,无目录层级划分,可直接用于该任务的模型训练、评估与结果复现。 文件详解 文件名称:runs-task2.zip 文件格式:ZIP 字段映射介绍:任务相关的运行结果压缩包,具体内容需解压后查看...
-
IR_Lab_Shared_Task_2024_2025冬季学期信息检索课程数据集
2026年1月15日 30 155 27
数据集概述 本数据集为2024/2025冬季学期科隆、耶拿、卡塞尔三校信息检索课程的共享任务资源,包含基于ir_datasets和TIREx的实验数据,涵盖文档语料、主题、运行结果及相关性判断等,支持课程实践中的系统开发与分析。 文件详解 训练输入文件 文件名称:subsampled-ms-marco-deep-...
-
水研究领域科学出版物信息检索测试集
2025年12月22日 30 78 18
数据集概述 该数据集包含水研究交叉领域的科学出版物信息检索测试集,分为ThWIC-Chemistry和ThWIC-Hierarchy两个子数据集。提供领域标签和属性标签,可用于衡量数据子集的主题多样性及属性代表性,为信息检索研究提供测试资源。 文件详解 文件名称:ThWIC_Datasets_description.pdf 文件格式:PDF...
-
新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997
2025年5月28日 30 79 20
新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997 数据来源:互联网公开数据 标签:新闻语料库,文本分类,信息检索,数据集,自然语言处理,机器学习,文本分析,相关性判断 数据概述: 该数据集包含来自新闻语料库(NF Corpus)的训练数据,记录了新闻文章及其与特定查询词的相关性判断。主要特征如下:...



