Wikidata_Dump_Based_RDF格式导出测试数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式导出测试数据,包含实体、陈述及三元组信息,共4个文件,覆盖JSON、GZ压缩、NT等格式,可用于Wikidata导出工具的功能验证与数据格式测试。

文件详解

  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段
  • 文件名称:wdump-77.nt.gz
  • 文件格式:GZ压缩
  • 字段映射介绍:压缩格式的NT文件,为RDF数据的压缩存储形式
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、version、aliases、entities、statements、labels、meta、descriptions等字段
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF格式的预览数据文件

适用场景

  • Wikidata导出工具验证: 用于测试wdumps工具生成RDF导出数据的准确性与完整性
  • RDF数据格式测试: 验证不同RDF文件格式(如NT)的解析与处理能力
  • 数据压缩算法测试: 测试GZ压缩格式对RDF数据的压缩效率与恢复效果
  • JSON数据结构分析: 分析Wikidata导出数据的JSON结构设计与字段映射关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。