Wikidata_Based_RDF格式数据转储_原始数据

数据集概述

本数据集为Wikidata的RDF格式数据转储,由wdumps工具生成。包含实体、陈述和三元组相关统计信息,共4个文件,涵盖JSON配置文件、预览文件及压缩数据文件,可用于Wikidata数据的存储、交换与语义分析。

文件详解

  • 配置与元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含meta、sitelinks、descriptions、labels、languages、aliases、statements、entities、version、samplingPercent等配置字段
  • 数据预览文件
  • 文件名称:preview.nt
  • 文件格式:NT(N-Triples)
  • 字段映射介绍:Wikidata数据的N-Triples格式预览文件
  • 压缩数据文件
  • 文件名称:wdump-1742.nt.gz
  • 文件格式:GZ(压缩文件)
  • 字段映射介绍:压缩的N-Triples格式Wikidata数据文件

适用场景

  • 语义网数据研究: 用于分析Wikidata的RDF数据结构和语义关系
  • 数据转储工具测试: 验证wdumps工具生成数据的格式与完整性
  • 元数据管理: 利用info.json和wdumper-spec.json进行数据版本和配置管理
  • 数据交换与存储: 作为Wikidata数据的标准化转储格式用于跨系统数据交换
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 431.41 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。