数据集概述
本数据集是通过wdumps工具生成的Wikidata RDF转储数据,聚焦于经济单元与商人主题。包含符合特定实例(如公司、企业、经济单元)和职业(商人)条件的实体数据,总实体数、陈述数、三元组数均为零,文件总数为4个,主要包含配置文件、预览文件和压缩数据文件。
文件详解
- 配置与元数据文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等结构描述字段
- 预览数据文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF三元组格式的预览数据文件
- 压缩数据文件
- 文件名称:wdump-2070.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩格式的RDF三元组数据文件
数据来源
Wikidata
适用场景
- 知识图谱构建: 用于构建经济领域相关的知识图谱,整合经济单元与商人实体信息
- 语义网研究: 分析RDF格式数据的结构特点与应用方法
- 数据工程实践: 作为Wikidata数据转储的示例,用于数据处理工具开发与测试
- 经济实体关系分析: 探索经济单元与商业人物之间的关联模式(需结合其他数据补充)