Wikidata_Based_RDF数据转储文件集合

数据集概述

本数据集是使用wdumps工具生成的Wikidata的RDF格式转储文件集合,包含4个文件,涵盖元数据、配置说明、压缩数据及预览数据等内容,可用于知识图谱相关的数据处理与分析场景。

文件详解

  • 元数据文件(info.json)
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基础元数据信息
  • 配置文件(wdumper-spec.json)
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、meta、entities、statements、sitelinks、labels、aliases、descriptions等字段,定义转储工具的配置规范
  • 压缩数据文件(wdump-443.nt.gz)
  • 文件名称:wdump-443.nt.gz
  • 文件格式:GZ(压缩格式,包含NT文件)
  • 字段映射介绍:Wikidata RDF数据的压缩文件,具体内容为NT格式的三元组数据
  • 预览数据文件(preview.nt)
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:Wikidata RDF数据的预览文件,包含三元组形式的知识图谱数据

适用场景

  • 知识图谱数据研究:用于分析Wikidata知识图谱的结构与内容
  • 数据转储工具测试:验证wdumps工具生成RDF转储文件的正确性与完整性
  • 数据格式转换实验:探索RDF格式数据与其他知识图谱格式的转换方法
  • 知识图谱应用开发:为知识图谱相关应用提供基础数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。