数据集

Touché22比较问题的论点检索数据集

数据集概述

该数据集为2022年Touché会议“比较问题的论点检索”任务的专用数据，包含问题主题、检索段落、评估结果等文件，覆盖相关性、立场、质量三类评估维度，支持论点检索算法的开发与评测。

文件详解

该数据集包含15个文件，按类型分为以下几类： - 问题与段落数据文件： - topics-task2-2022.zip：压缩文件，包含任务相关的比较问题主题数据 - touche-task2-passages-version-002.jsonl.gz：压缩JSONL文件，基础段落数据集 - touche-task2-passages-version-002-expanded-with-doc-t5-query.jsonl.gz：压缩JSONL文件，扩展后的段落数据集 - marco_comp_all_fields.tsv：TSV文件，包含比较问题、查询ID、段落等字段，如question（问题）、query_id（查询ID）、passages（段落文本） - 评估标准文件（.qrels格式）： - touche-task2-2022-relevance.qrels：相关性评估标准文件 - touche-task2-2022-stance.qrels：立场评估标准文件 - touche-task2-2022-quality.qrels：质量评估标准文件 - 结果文件： - 结果CSV文件：task2_relevance_results_full.csv（相关性结果，含Team、Tag、Topic、nDCG@5等字段）、task2_stance_results_full.csv（立场结果）、task2_quality_results_full.csv（质量结果） - 结果HTML文件：task2_relevance_results_all.html（相关性结果网页）、task2_stance_results_all.html（立场结果网页）、task2_quality_results_all.html（质量结果网页） - 算法提交结果压缩包： - touche2022-task2-runs.zip：压缩文件，包含各团队提交的算法运行结果

适用场景

信息检索研究：开发与评测比较问题的论点检索算法
自然语言处理：研究比较类问题的文本理解与论点抽取技术
算法评估：基于相关性、立场、质量指标评估检索模型性能
问答系统优化：提升比较类问题的答案论点支撑能力

数据与资源

该数据集没有数据

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.0 MiB
最后更新	2025年12月22日
创建于	2025年12月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。