Wikidata_Wdumps_Based测试RDF转储数据

数据集概述

本数据集是使用wdumps工具生成的Wikidata测试RDF转储,包含4个文件,实体数、陈述数和三元组数均为0。文件类型涵盖JSON、GZ压缩文件和NT文件,可用于测试Wikidata转储数据的处理流程和工具兼容性。

文件详解

  • 核心配置文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等配置字段
  • 数据文件
  • 文件名称:wdump-2078.nt.gz
  • 文件格式:GZ压缩文件
  • 字段映射介绍:压缩格式的NT文件,为Wikidata RDF数据的存储形式
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:未压缩的NT文件,用于预览RDF数据格式

数据来源

Wikidata(通过wdumps工具生成)

适用场景

  • Wikidata转储工具测试: 验证wdumps等工具生成RDF转储的流程正确性和格式兼容性
  • 知识图谱数据处理测试: 用于测试RDF数据解析、存储和查询工具的功能
  • 数据格式转换研究: 分析Wikidata RDF转储的文件结构和字段映射规则
  • 测试环境搭建: 为Wikidata相关应用开发提供轻量级测试数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 18.07 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。