Wikidata_Based_Wikidata知识库数据Dump

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含4个文件,涵盖JSON、NT、GZ等格式,主要记录Wikidata的实体、标签、陈述等元数据信息,当前实体、陈述及三元组计数均为0。

文件详解

  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储工具版本、日期及数据计数等元信息
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、entities、statements、aliases、version、descriptions、sitelinks、meta等键,定义Wikidata转储的结构规范
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:Wikidata数据的预览NT格式文件
  • 文件名称:wdump-22.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩的Wikidata转储NT格式文件

适用场景

  • 知识库数据结构研究: 分析Wikidata的实体、标签、陈述等元数据结构
  • 数据转储工具验证: 验证wdumps工具生成Wikidata RDF转储的格式与规范
  • 知识库数据备份参考: 作为Wikidata数据备份的格式参考案例
  • 语义网数据格式分析: 研究NT格式在语义网数据存储中的应用
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.51 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。