数据集概述
本数据集是通过wdumps工具生成的Wikidata人物信息RDF格式Dump,包含4个文件,涵盖数据元信息、生成配置、预览数据等内容,为Wikidata人物实体相关的数据分析与应用提供基础数据支持。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- wdump-1041.nt.gz
- 文件格式:GZ压缩文件
- 内容说明:压缩的RDF数据文件(NT格式)
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta、languages等配置字段
- preview.nt
- 文件格式:NT
- 内容说明:RDF预览数据文件
数据来源
Wikidata
适用场景
- 语义网研究:用于RDF数据模型、知识图谱构建等语义网相关研究
- 人物信息分析:基于Wikidata人物数据开展人物关系、属性特征等分析
- 数据挖掘应用:作为基础数据支撑人物相关的数据挖掘任务
- 知识图谱构建:为构建人物领域知识图谱提供原始数据来源