找到10个数据集

分类: 公开数据 标签: 问答对

过滤结果
  • SciRAG_QA_Based_多领域科学封闭问题问答基准数据集

    2026年2月9日 30 193 175

    数据集概述 本数据集是用于科学问答(QA)系统基准测试的多领域封闭问题数据集,覆盖10个研究领域下的34个主题,包含108条人工标注的问答对,每条数据标注了答案类型、难度等级及带来源论文链接的黄金参考,可用于验证检索增强生成(RAG)系统在科学领域的性能。 文件详解 metadata.csv 文件格式:CSV...
    packageimg
  • IAC_PAC_Q_A_PAIRS问答对数据

    2026年2月1日 30 182 79

    数据集概述 本数据集包含IAC_PAC相关的问答对内容,以单一文件形式呈现,未进行训练/测试、数据/标签或原始/处理数据的划分,可用于问答系统相关的研究与应用。 文件详解 文件名称:IAC_PAC_Q&A_PAIRS.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段预览,推测包含问答对相关的核心字段(如问题、答案等)。 适用场景...
    packageimg
  • TopiOCQA_Based_问答处理数据集

    2026年2月1日 30 147 6

    数据集概述 本数据集为TopiOCQA项目的处理数据集,包含18个文件,涉及训练集和验证集数据,涵盖黄金段落信息、检索器数据等内容,支持问答系统相关研究与实验,文件格式以JSON和CSV为主。 文件详解 黄金段落信息文件 目录路径:data/gold_passages_info/...
    packageimg
  • SPIKE_QA_Based_英文多主题问答微调数据集

    2026年1月31日 30 40 7

    数据集概述 本数据集为SPIKE-QA,是由GPT4o-small模型生成、经Python脚本整合的英文问答数据集,包含50,236对零样本问答样本。主题覆盖基础科学(物理、化学、数学)、复杂生成问题及日常对话,以CSV格式存储,便于模型微调与评估。 文件详解 文件名称:SPIKE-QA.zip 文件格式:ZIP...
    packageimg
  • Minecraft_QA_Based_游戏问答指令训练数据集

    2026年1月29日 30 68 42

    数据集概述 本数据集为训练大型语言模型(LLMs)处理Minecraft相关问题设计,包含超过39万条指令条目,通过LLM辅助方法生成。数据集提供高质量、多样化的问答对,分为短答案、长答案、布尔答案和普通答案四类,适用于模型训练。 文件详解 文件名称:minecraft_instruction_dataset.json 文件格式:JSON...
    packageimg
  • CLEVRER_Humans_Based物理事件因果判断视频推理基准数据

    2026年1月21日 30 9 7

    数据集概述 本数据集为CLEVRER-Humans基准,是包含人类标注的物理事件因果判断视频推理数据集。通过迭代事件完形填空任务生成因果事件图(CEGs),结合神经语言生成模型增强数据,将CEGs转换为问答对,包含视频、标注、问题及CEGs四部分内容,用于评估物理事件因果推理能力。 文件详解 README.md 文件格式:MD...
    packageimg
  • DBLP_QuAD学术知识图谱问答数据集

    2025年12月21日 30 28 5

    数据集概述 该数据集基于DBLP学术知识图谱构建,包含一万条问答对及对应的SPARQL查询语句,可用于在DBLP知识图谱上执行查询获取正确答案,是首个面向学术知识图谱的问答数据集。 文件详解 文件名称:DBLP-QuAD.zip 文件格式:ZIP压缩包...
    packageimg
  • 教育西班牙语问答数据集_ESQAD

    2025年12月19日 30 73 53

    数据集概述 本数据集为西班牙语教育场景下的问答生成(QAG)任务构建,包含与西班牙大学入学考试(EVAU)课程对齐的人工标注数据、文学及法律领域自动生成数据,以及经师生验证的试点研究子集,支持多场景QAG模型开发与评估。 文件详解 该数据集包含四类结构化数据文件,具体说明如下: - EVAU课程对齐数据 -...
    packageimg
  • 糖尿病黄斑水肿视觉问答数据集

    2025年12月11日 30 201 69

    数据集概述 该数据集是基于IDRiD和eOphta数据集构建的医学视觉问答(VQA)数据集,包含健康与病变眼底图像,针对每张图像生成预定义问题,部分区域相关问题附带位置掩码,可用于研究VQA模型的一致性。 文件详解 文件名称: dme_vqa.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 跨性别与非二元性别主题的Quora问题及大语言模型回复数据集

    2025年12月10日 30 152 59

    数据集概述 本数据集包含关于跨性别与非二元性别主题的Quora问题、问答对、编码问答对及研究代码本,支撑相关研究分析,为理解大语言模型在该领域的表现提供数据基础。 文件详解 文件名称:Ratings.xlsx 文件格式:Excel表格(.xlsx) 内容说明:可能包含对问题或回复的评分数据,具体字段需基于文件内容确定 文件名称:Quora...
    packageimg