Wikidata_Based_RDF数据转储_数据集

数据集概述

本数据集为通过wdumps工具生成的Wikidata RDF格式转储数据,包含4个文件,涉及JSON、NT、GZ三种格式。数据涵盖转储元信息、配置规范及示例数据,可用于Wikidata知识图谱相关的存储与处理分析。

文件详解

  • 元信息文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 配置规范文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、descriptions、entities、sitelinks、labels、version、meta、aliases等配置字段
  • 示例数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF格式的示例数据文件
  • 压缩数据文件
  • 文件名称:wdump-917.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩后的RDF数据文件

数据来源

通过wdumps工具生成的Wikidata数据

适用场景

  • 知识图谱研究:用于Wikidata知识图谱的存储格式分析与数据结构研究
  • 数据转储技术分析:探究RDF格式数据转储的工具流程与配置规范
  • 语义网应用开发:为基于Wikidata的语义网应用提供数据格式参考
  • 数据压缩与存储优化:分析RDF数据的压缩存储方式及效率
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。