Wikidata_RDF_Based知识图谱转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、陈述、三元组等核心内容的结构化记录。数据集总计4个文件,覆盖JSON、NT、GZ三种格式,提供工具版本、转储日期、实体统计等元信息,以及知识图谱的结构化规范与预览数据,是Wikidata数据应用与分析的基础资源。

文件详解

  • JSON格式文件
  • 文件名称:info.json
  • 字段映射介绍:包含id、wdtkVersion(工具版本)、toolVersion(工具版本)、dumpDate(转储日期)、tripleCount(三元组数量)、entityCount(实体数量)、statementCount(陈述数量)等元数据字段
  • 文件名称:wdumper-spec.json
  • 字段映射介绍:包含statements(陈述)、descriptions(描述)、entities(实体)、sitelinks(站点链接)、labels(标签)、version(版本)、meta(元数据)、aliases(别名)等知识图谱结构定义字段
  • NT格式文件
  • 文件名称:preview.nt
  • 内容说明:Wikidata RDF数据的预览文件,采用NT(N-Triples)格式存储知识图谱三元组
  • GZ压缩文件
  • 文件名称:wdump-862.nt.gz
  • 内容说明:NT格式Wikidata转储数据的压缩包,包含完整的知识图谱三元组数据

适用场景

  • 知识图谱构建与分析:基于RDF格式数据构建Wikidata知识图谱,分析实体关系与属性特征
  • 语义网技术研究:利用NT格式三元组数据开展语义网存储、查询与推理技术研究
  • 数据转储工具评估:通过info.json元数据评估wdumps工具的转储效率与数据完整性
  • 知识图谱应用开发:基于结构化规范文件(wdumper-spec.json)开发Wikidata数据的应用接口与服务
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 28.6 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。