Wikidata_Based_Wikidata辅助转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata辅助RDF转储数据,包含4个文件,涵盖配置说明、元信息、RDF数据文件等内容。数据实体数、陈述数和三元组数均为0,可用于了解Wikidata转储的文件结构与配置规范。

文件详解

  • 配置说明文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、version、statements、samplingPercent、aliases、meta、sitelinks、descriptions、languages、entities等配置项,定义转储参数与结构规范
  • 元信息文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段,记录转储工具版本、日期及数据统计信息
  • 压缩RDF数据文件
  • 文件名称:wdump-1589.nt.gz
  • 文件格式:GZ压缩文件(内部为NT格式)
  • 字段映射介绍:Wikidata转储的RDF三元组数据压缩文件
  • 预览RDF数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:Wikidata转储的RDF三元组预览数据文件

适用场景

  • Wikidata转储工具配置研究:通过wdumper-spec.json分析Wikidata转储工具的参数设置规范
  • RDF数据文件结构分析:研究Wikidata转储的RDF文件格式与内容组织方式
  • 数据转储元信息统计:利用info.json了解转储工具版本、日期等元数据特征
  • 知识图谱数据处理参考:作为Wikidata类知识图谱转储流程的辅助参考资料
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 28.49 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。