SKG_Based_70篇AI论文并行标注与金标准数据

数据集概述

本数据集包含4个主流科学知识图谱(OpenAlex、OpenAIRE、ORKG、Papers with Code)对70篇AI相关论文的并行类别标注,以及人工整理的语义准确的金标准标注,用于评估SKG标注质量与一致性。

文件详解

  • initial_dataset.json
  • 文件格式:JSON
  • 字段映射介绍:直接从SKG的API或数据 dump 中获取的原始标注数据,仅经过最小化处理,保留各SKG对70篇AI论文的原始类别标注信息。
  • gold_standard.json
  • 文件格式:JSON
  • 字段映射介绍:人工筛选的金标准标注数据,仅包含被判定为语义准确的标注内容,作为评估SKG标注质量的基准。

数据来源

论文“Are Scientific Annotations Consistently Represented across Science Knowledge Graphs?”

适用场景

  • SKG标注质量评估: 对比原始标注与金标准,分析各科学知识图谱标注的准确性。
  • SKG标注一致性分析: 研究不同SKG对同一AI论文标注类别的差异与一致性程度。
  • 学术知识图谱优化: 为科学知识图谱的标注体系改进提供实证数据支持。
  • AI论文分类研究: 基于多源SKG标注数据,探索AI领域论文分类的标准化方法。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.34 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。