-
NicheHazardQA_Based_问答系统数据集
2026年2月7日 30 75 58
数据集概述 本数据集为NicheHazardQA,包含一个JSON格式文件,未划分训练/测试集、数据/标签集及原始/处理数据集,无说明文档或内容预览,主要用于问答相关任务。 文件详解 数据文件 文件名称:NICHEHAZARDQA.json 文件格式:JSON 字段映射介绍:无可用内容预览,具体字段信息未提供 适用场景 问答系统开发:...
-
IAC_PAC_Q_A_PAIRS问答对数据
2026年2月1日 30 134 78
数据集概述 本数据集包含IAC_PAC相关的问答对内容,以单一文件形式呈现,未进行训练/测试、数据/标签或原始/处理数据的划分,可用于问答系统相关的研究与应用。 文件详解 文件名称:IAC_PAC_Q&A_PAIRS.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段预览,推测包含问答对相关的核心字段(如问题、答案等)。 适用场景...
-
TopiOCQA_Based_问答处理数据集
2026年2月1日 30 199 30
数据集概述 本数据集为TopiOCQA项目的处理数据集,包含18个文件,涉及训练集和验证集数据,涵盖黄金段落信息、检索器数据等内容,支持问答系统相关研究与实验,文件格式以JSON和CSV为主。 文件详解 黄金段落信息文件 目录路径:data/gold_passages_info/...
-
ACL25_Based_多轮系统对话数据_压缩包
2026年2月1日 30 137 9
数据集概述 本数据集包含ACL25相关的多轮系统对话内容,以压缩包形式提供,未划分训练/测试集、数据/标签集或原始/处理数据,无额外说明文档或内容预览,整体结构简洁,仅含一个压缩文件。 文件详解 压缩文件 文件名称:acl25-multiple-system-turns-dialogs.zip 文件格式:ZIP...
-
PANDAX_Based_工业系统问答解释数据集
2026年2月1日 30 150 1
数据集概述 本数据集为PANDAX(基于专利的工业问答解释数据集),是首个开源工业QAE数据集。数据源自PDF格式的专利文件,聚焦冷却系统、绿色技术(如可再生能源、碳捕获与存储)等工业系统领域,包含一千八百六十个QAE三元组,覆盖系统信息的部分onomy、功能、参数三类问题主题。 文件详解 PDF_patens.zip 文件格式:ZIP...
-
TopiOCQA_独立文件_问答任务训练验证数据集
2026年1月31日 30 196 63
数据集概述 本数据集为TopiOCQA数据集的独立文件,包含训练和验证两个JSON文件,无目录结构,文件类型统一为JSON格式,可用于问答相关任务的模型训练与验证。 文件详解 训练文件 文件名称:topiocqa_train.json 文件格式:JSON 字段映射介绍:未提供具体字段信息,推测包含问答任务训练所需的输入输出数据。 验证文件...
-
PathwayQA_Based医学疾病与反应问答数据集
2026年1月30日 30 131 126
数据集概述 本数据集为PathwayQA医学问答数据集,包含6个文件,涵盖医学疾病与反应相关的问答内容,涉及零样本、单样本、两样本问答及反应、通路的JSON数据。主要文件类型为CSV和JSON,无目录结构,未划分训练测试或数据标签集,可用于生物医学领域的问答任务研究。 文件详解 CSV文件(共4个)...
-
ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据
2026年1月30日 30 178 84
数据集概述 本数据集为斯洛文尼亚气候问答基准(ClimaQA_SLO),用于检验大语言模型在斯洛文尼亚环境相关领域(如气候变化、能源、林业)的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容,支持评估模型的气候领域专业知识准确性。 文件详解 文件名称:ClimaQA_SLO.xlsx 文件格式:XLSX...
-
LLMs_Heroes_Based_英雄主题问答文档数据
2026年1月30日 30 19 12
数据集概述 本数据集围绕“LLMs Heroes”主题展开问答内容,包含一份问答文档,可用于了解该主题下的相关问答信息,为相关研究或应用提供基础数据支持。 文件详解 文件名称:Questions and Answers_LLMs_Heroes.docx 文件格式:DOCX 字段映射介绍:文档类文件,具体字段信息未提供,推测包含与“LLMs...
-
TACO_Source_Twitter对话论点开源发布数据
2026年1月30日 30 138 7
数据集概述 本数据集为TACO(Twitter Arguments from COnversations)的开源发布数据,包含Twitter对话中的论点内容,以压缩包形式提供,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:TomatenMarc/TACO-Public-Data.zip 文件格式:.zip...
-
PhAQ_Based_直觉物理问答多模态神经网络训练数据集
2026年1月29日 30 125 24
数据集概述 本数据集为论文《PhAQ: Intuitive Physics Question Answering for Multi-Modal Neural Network training》配套数据,包含两种划分的压缩文件,用于多模态神经网络训练相关的直觉物理问答任务。 文件详解 500-split.zip 文件格式:ZIP...
-
BioASQ_Based_生物医学专家真实需求问答基准数据集
2026年1月29日 30 160 82
数据集概述 本数据集为BioASQ生物医学问答基准数据集,包含英文问题、标准参考答案及相关材料,反映生物医学专家真实信息需求,兼具挑战性与实用性。数据集融合结构化与非结构化数据,除精确答案外还包含理想答案(摘要形式),适用于问答系统、多文档摘要、信息检索等多任务研究,且随BioASQ挑战赛持续扩展。 文件详解 README文件 文件名称:README...
-
Minecraft_QA_Based_游戏问答指令训练数据集
2026年1月29日 30 69 17
数据集概述 本数据集为训练大型语言模型(LLMs)处理Minecraft相关问题设计,包含超过39万条指令条目,通过LLM辅助方法生成。数据集提供高质量、多样化的问答对,分为短答案、长答案、布尔答案和普通答案四类,适用于模型训练。 文件详解 文件名称:minecraft_instruction_dataset.json 文件格式:JSON...
-
Falcon_2_0_Based_QA属性识别失败分析数据集
2026年1月29日 30 67 5
数据集概述 本数据集包含Falcon 2.0 API对LC-QuAD 1.0、QALD 1-9、SimpleDBpediaQA三个问答数据集进行属性识别分析的结果,聚焦识别失败的属性信息。数据以JSON格式存储,记录了每个问题的来源数据集、原始问题文本及未被正确识别的SPARQL所需属性列表,为问答系统属性识别优化提供参考。 文件详解...
-
DBpedia_Based_知识库问答问题与答案类型标注数据集
2026年1月29日 30 30 23
数据集概述 本数据集包含37279个基于DBpedia的知识库问答问题,以及对应的答案类别和类型列表。问题来源于QALD 1-9、LC-QuAD 1.0和SimpleDBpediaQA的训练与测试数据集,答案类型体系采用自ISWC 2020的SMART-task挑战标准,为知识库问答任务的模型训练与评估提供标注数据支持。 文件详解...
-
tags_math_sx_Based_数学标签时序高阶网络数据集
2026年1月28日 30 59 15
数据集概述 本数据集为时序高阶网络数据,记录数学问答平台(math.stackexchange.com)中问题标签的使用情况。数据以带时间戳的超边序列形式呈现,每个超边对应一个问题的标签集合,节点为标签,时间戳以毫秒为单位且最早起始于0。数据集包含1,629个节点、822,059条带时间戳超边及174,933条唯一超边。 文件详解 文件名称:tags-...
-
Wikidata_drinks_all_饮品实体RDF数据Dump
2026年1月27日 30 47 7
数据集概述 本数据集是基于wdumps工具生成的Wikidata饮品相关实体RDF Dump,包含39个实体、229条陈述和2754条三元组数据,以4个文件存储,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:info.json 文件格式:JSON...
-
Deep_learning_Based_孟加拉语深度学习问答系统数据集
2026年1月26日 30 199 41
数据集概述 本数据集是论文《Deep learning based question answering system in Bengali》的配套数据,为SQuAD 2.0数据集的孟加拉语翻译版本,包含训练、验证及预处理翻译结果三类文件,共3个JSON格式文件,可用于孟加拉语问答系统的深度学习研究。 文件详解...
-
ECQuAD_GoBots_Based_巴西电商问答阅读理解开发数据集
2026年1月26日 30 103 32
数据集概述 本数据集是针对巴西电商平台的阅读理解问答数据集(ECQuAD),由众包工作者基于商品描述标注问题,遵循SQuAD-v2格式,包含可回答与不可回答问题。数据集为开发版本,供公开使用,由GoBots提供,仅含一个文件。 文件详解 文件名称:ecquad_dev_v2.json 文件格式:JSON...
-
Spanish_Workers_Statute_Based_双语问答数据集
2026年1月21日 30 84 25
数据集概述 本数据集为西班牙语劳动法关键文件的双语问答数据集,包含150个问题及其对应答案,答案形式为西班牙《工人法规》130个部分中的条款编号及相关摘录。数据集支持信息检索与问答任务,共包含3个文件。 文件详解 Extracted Terminology of Spanish Worker Statute.txt 文件格式:TXT...



