PANDAX_Based_工业系统问答解释数据集

数据集概述

本数据集为PANDAX(基于专利的工业问答解释数据集),是首个开源工业QAE数据集。数据源自PDF格式的专利文件,聚焦冷却系统、绿色技术(如可再生能源、碳捕获与存储)等工业系统领域,包含一千八百六十个QAE三元组,覆盖系统信息的部分onomy、功能、参数三类问题主题。

文件详解

  • PDF_patens.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含衍生出QAE数据的原始专利PDF文件,涉及冷却系统、绿色技术等工业系统领域的专利内容
  • PANDAX_dataset.json
  • 文件格式:JSON
  • 字段映射介绍:包含一千八百六十个QAE三元组数据,覆盖系统信息的部分onomy、功能、参数三类问题主题

适用场景

  • 工业系统问答模型训练: 用于训练和优化针对冷却系统、绿色技术等工业领域的问答解释模型
  • 专利信息挖掘研究: 基于专利PDF文件和QAE数据,开展工业技术领域的专利信息提取与分析
  • 工业知识图谱构建: 利用QAE三元组数据,构建工业系统领域的知识图谱,支撑知识检索与推理
  • 问答解释技术研究: 为工业领域问答解释(QAE)技术的算法开发和性能评估提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 58.45 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。