找到3个数据集

分类: 公开数据 标签: 人工标注数据

过滤结果
  • 教育西班牙语问答数据集_ESQAD

    2025年12月19日 30 66 48

    数据集概述 本数据集为西班牙语教育场景下的问答生成(QAG)任务构建,包含与西班牙大学入学考试(EVAU)课程对齐的人工标注数据、文学及法律领域自动生成数据,以及经师生验证的试点研究子集,支持多场景QAG模型开发与评估。 文件详解 该数据集包含四类结构化数据文件,具体说明如下: - EVAU课程对齐数据 -...
    packageimg
  • 自然语言处理大型语言模型蜕变测试数据集2025

    2025年12月19日 30 73 70

    数据集概述 本数据集是ICSME 2025会议论文相关研究的配套数据,围绕自然语言处理(NLP)任务中大型语言模型(LLM)的蜕变测试展开,包含RQ1至RQ3及额外分析的实验结果、人工标注与汇总数据,所有文件以JSON格式存储,为LLM蜕变测试研究提供支撑。 文件详解 该数据集以ZIP压缩包形式组织,内部包含多个JSON文件和目录,具体说明如下: -...
    packageimg
  • BigGrams半监督HTML信息提取系统数据集

    2025年12月15日 30 1 0

    数据集概述 该数据集为BigGrams半监督HTML信息提取系统相关的参考数据集,包含从真实网站抓取的网页数据,以及对应网站的人工标注参考实例数据,用于支持半监督信息提取方法的研究与验证。 文件详解 数据集包含一个ZIP压缩文件,解压后包含两个主要文件夹,具体说明如下: - 压缩文件: bigrams-reference-data-...
    packageimg