数据集概述
本数据集是基于wdumps工具生成的Wikidata P279关系RDF转储数据,包含4个文件,涵盖数据规格、元信息、压缩数据及预览数据四类内容,可用于知识图谱构建、语义关系分析等场景。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元信息字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、labels、entities、meta、aliases、sitelinks、descriptions、statements等数据规格字段
- 文件名称:wdump-910.nt.gz
- 文件格式:GZ压缩文件
- 字段映射介绍:Wikidata P279关系的RDF数据压缩包
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:Wikidata P279关系的RDF预览数据文件
适用场景
- 知识图谱构建: 基于P279关系数据构建或扩展领域知识图谱的层级结构
- 语义关系分析: 分析Wikidata中实体间的子类关系(P279)特征与分布
- 知识工程研究: 用于研究RDF数据格式在知识表示中的应用
- 数据转储工具验证: 验证wdumps工具生成RDF数据的准确性与完整性