数据集概述
本数据集是基于wdumps工具生成的Wikidata P279属性相关RDF数据转储,包含4个文件,覆盖JSON、NT、GZ等格式,记录了数据转储的元信息、规范配置及预览数据,可用于知识图谱构建与分析。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元信息字段,记录数据转储的基本属性
- preview.nt
- 文件格式:NT
- 字段映射介绍:Wikidata P279属性相关的RDF三元组预览数据
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、labels、entities、meta、aliases、sitelinks、descriptions、statements等键的配置文件,定义数据转储规范
- wdump-910.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩格式的Wikidata P279属性RDF三元组数据文件
适用场景
- 知识图谱构建:用于提取Wikidata中P279(子类关系)属性的结构化数据,支撑知识图谱的关系网络搭建
- 语义网研究:分析RDF格式的知识表示逻辑,探索Wikidata数据的语义关联规则
- 数据转储工具验证:基于wdumper-spec.json的配置信息,验证wdumps工具的转储功能与输出规范
- 知识图谱预览分析:通过preview.nt文件快速查看P279属性的RDF数据样例,辅助数据应用场景测试