-
PAN25_Based_多作者写作风格变化检测数据集
2026年1月31日 30 105 95
数据集概述 本数据集为PAN@CLEF2025共享任务“多作者写作风格分析”专用数据,核心任务是检测多作者文档中句子级的写作风格变化位置。数据集包含易、中、难三个难度等级,分别对应不同主题多样性的文档,各等级均划分训练、验证、测试集。 文件详解 文件名称:pan25-multi-author-analysis.zip 文件格式:ZIP...
-
水研究领域科学出版物信息检索测试集
2025年12月22日 30 37 6
数据集概述 该数据集包含水研究交叉领域的科学出版物信息检索测试集,分为ThWIC-Chemistry和ThWIC-Hierarchy两个子数据集。提供领域标签和属性标签,可用于衡量数据子集的主题多样性及属性代表性,为信息检索研究提供测试资源。 文件详解 文件名称:ThWIC_Datasets_description.pdf 文件格式:PDF...



