Wikidata数据转储_RDF数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF格式转储数据,包含实体、陈述和三元组信息,共4个文件,涵盖JSON、GZ压缩包、NT格式等类型,可用于Wikidata相关的知识图谱研究与应用。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本信息。
  • wdump-206.nt.gz
  • 文件格式:GZ压缩包
  • 内容说明:压缩的NT格式RDF数据文件。
  • preview.nt
  • 文件格式:NT
  • 内容说明:NT格式的RDF预览数据文件。
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含descriptions、sitelinks、entities、meta、version、statements、aliases、labels等字段,记录转储的规格信息。

适用场景

  • 知识图谱研究:用于分析Wikidata的知识结构和数据特征。
  • 语义网应用开发:基于RDF格式数据构建语义网相关应用。
  • 数据转储技术研究:研究wdumps工具生成RDF转储的方法与流程。
  • 信息检索与数据挖掘:利用Wikidata转储数据进行信息检索和数据挖掘实验。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月15日
创建于 2026年2月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。