数据集概述
本数据集是由wdumper工具生成的Wikidata站点(de)的RDF转储数据,包含实体计数、陈述计数、三元组计数均为0的信息,以及4个相关文件,涵盖JSON、GZ、NT等格式,用于记录转储配置和元数据。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等键值对,记录转储的元数据信息。
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等键值对,记录转储的配置规范。
- 文件名称:wdump-2610.nt.gz
- 文件格式:GZ压缩文件
- 字段映射介绍:压缩的NT格式文件,可能包含RDF数据(当前实体、陈述、三元组计数均为0)。
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:NT格式的预览文件,可能包含RDF数据(当前实体、陈述、三元组计数均为0)。
数据来源
Wikidata(由wdumper工具生成)
适用场景
- 知识图谱数据转储研究:分析Wikidata转储的配置和元数据结构。
- 数据工具测试:用于测试wdumper工具生成RDF转储的功能和性能。
- 数据格式研究:研究JSON、GZ、NT等格式在知识图谱数据存储中的应用。
- 元数据管理:学习和应用转储元数据的记录和管理方法。