数据集概述
本数据集是由wdumps工具生成的Wikidata政治人物RDF转储数据,包含与政治人物相关的实体信息。数据集共有4个文件,涵盖JSON、NT等格式,包含实体、陈述、三元组等相关数据统计及配置信息。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录数据集的基本信息和统计数据。
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含languages、sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等字段,描述数据集的生成规范和结构。
- preview.nt
- 文件格式:NT
- 字段映射介绍:政治人物相关的RDF三元组预览数据。
- wdump-2065.nt.gz
- 文件格式:GZ压缩的NT文件
- 字段映射介绍:压缩格式的政治人物相关RDF三元组数据。
适用场景
- 政治人物信息分析: 用于挖掘和分析政治人物的相关属性和关系。
- 知识图谱构建: 作为知识图谱构建的数据源,补充政治人物领域的知识。
- 数据挖掘研究: 用于数据挖掘算法在知识图谱数据上的应用研究。
- 语义网技术研究: 支持语义网相关技术(如RDF数据处理)的研究和实验。