IntelliGraphs_Based知识图谱生成模型基准测试数据集

数据集概述

本数据集是IntelliGraphs知识图谱生成模型基准测试数据集,包含三个合成数据集(syn-paths、syn-tipr、syn-types)和两个真实世界数据集(wd-movies、wd-articles),共5个压缩文件。配套Python包可加载数据集并基于预定义语义验证新图谱,支持生成模型开发与测试。

文件详解

  • 合成数据集文件
  • 文件名称:syn-types.zip、syn-tipr.zip、syn-paths.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含三类合成知识图谱数据,具体字段需解压后查看原始内容,用于模拟不同场景的知识图谱生成任务。
  • 真实世界数据集文件
  • 文件名称:wd-movies.zip、wd-articles.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含基于真实世界数据构建的知识图谱数据(如电影、文章相关实体与关系),具体字段需解压后查看原始内容,用于真实场景的模型测试。

适用场景

  • 知识图谱生成模型性能评估: 用于测试不同生成模型在合成与真实场景下的图谱构建准确性、完整性。
  • 生成模型开发测试: 作为开发新的知识图谱生成模型的实验测试床,验证模型效果。
  • 语义验证方法研究: 利用配套Python包的预定义语义验证功能,研究知识图谱的语义一致性验证机制。
  • 基准测试数据集对比分析: 对比合成数据集与真实世界数据集在模型测试中的差异,优化模型泛化能力。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 13.08 MiB
最后更新 2026年1月25日
创建于 2026年1月25日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。