WD50K_Based_Wikidata超关系知识图谱数据集_2019

数据集概述

本数据集是基于2019年8月Wikidata RDF dump构建的超关系数据集,通过提取FB15K-237实体映射的种子节点及其带限定符的陈述,过滤字面量和低提及实体后划分训练、验证、测试集,再采样得到WD50K_33、WD50K_66、WD50K_100三个变体,分别对应不同比例的超关系事实。

文件详解

  • 文件名称:WD50K.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包包含主数据集WD50K及三个变体WD50K_33、WD50K_66、WD50K_100,各数据集涵盖陈述、实体、关系等统计信息,包含带限定符的超关系事实及训练/验证/测试划分数据。

数据来源

Wikidata RDF dump(2019年8月)

适用场景

  • 超关系知识图谱构建: 用于构建包含限定符信息的复杂知识图谱结构。
  • 知识图谱推理模型训练: 支持超关系知识图谱上的消息传递、链接预测等模型训练与验证。
  • 知识图谱补全研究: 分析限定符对知识图谱补全任务的影响。
  • 知识图谱变体分析: 对比不同超关系事实比例的数据集对模型性能的影响。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.75 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。