Wikidata_Based_RDF格式测试转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式测试转储数据,包含四个文件,涵盖信息描述、规格配置、预览数据等内容,可用于验证Wikidata转储流程和文件结构。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,描述转储的基本信息
  • wdump-1624.nt.gz
  • 文件格式:GZ压缩文件
  • 字段映射介绍:压缩的N-Triples格式数据文件
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、version、statements、samplingPercent、aliases、meta、sitelinks、descriptions、entities等字段,描述转储工具的规格配置
  • preview.nt
  • 文件格式:N-Triples
  • 字段映射介绍:N-Triples格式的预览数据文件

适用场景

  • Wikidata转储流程验证:测试wdumps工具生成RDF格式转储数据的流程正确性
  • 文件结构分析:分析Wikidata转储文件的格式和内容组成
  • 工具配置参考:参考wdumper-spec.json中的配置参数优化转储工具设置
  • 数据格式测试:验证N-Triples格式数据的解析和处理能力
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。