Wikidata_Based_测试用RDF转储数据_Dump

数据集概述

本数据集是使用wdumper工具生成的Wikidata测试用RDF转储数据,包含四个文件,实体数、陈述数和三元组数均为0。文件类型涵盖JSON、NT和GZ压缩格式,包含配置信息、规格说明和预览数据,可用于验证Wikidata转储工具的输出格式和结构。

文件详解

  • 配置与信息文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本元信息
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等字段,定义转储工具的配置规格
  • 数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:Wikidata测试转储的预览数据文件,三元组数为0
  • 文件名称:wdump-2920.nt.gz
  • 文件格式:GZ压缩包
  • 字段映射介绍:包含NT格式的Wikidata测试转储数据,已压缩

适用场景

  • Wikidata转储工具验证: 用于测试wdumper工具生成RDF转储的格式正确性和配置有效性
  • 数据格式兼容性测试: 验证系统对Wikidata RDF转储文件(JSON、NT、GZ)的解析能力
  • 数据处理流程测试: 作为测试数据,验证Wikidata转储数据的读取、转换和存储流程
  • 数据架构设计参考: 参考info.json和wdumper-spec.json的结构,设计Wikidata转储数据的处理架构
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 20.59 MiB
最后更新 2026年2月8日
创建于 2026年2月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。