数据集概述
本数据集是Wikidata中P279属性的RDF格式转储数据,由wdumps工具生成。包含实体、陈述及三元组信息,覆盖实体数量约245万、陈述数量约2626万、三元组数量约3822万,共4个文件,支持知识图谱相关研究与应用。
文件详解
- 配置与元数据文件
- 文件名称:info.json、wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:info.json含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据;wdumper-spec.json含version、labels、entities、meta、aliases、sitelinks、descriptions、statements等配置键
- 数据预览文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF三元组预览文件,包含资源描述框架的基础三元组数据
- 压缩数据文件
- 文件名称:wdump-749.nt.gz
- 文件格式:GZ(压缩包内为NT格式)
- 字段映射介绍:压缩后的RDF三元组数据文件,存储Wikidata P279属性的完整三元组信息
数据来源
Wikidata(由wdumps工具生成)
适用场景
- 知识图谱构建与扩展: 用于构建或补充包含P279属性(子类关系)的知识图谱,完善语义关联
- 语义网技术研究: 分析RDF格式数据结构,探索三元组存储与查询优化
- 知识推理应用开发: 基于P279属性的子类关系,开发领域知识推理模型
- 数据挖掘与关联分析: 挖掘实体间的子类关联模式,支持领域知识发现