知识库_Wikidata实体数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF转储数据,包含4个文件,实体数、陈述数、三元组数均为0。文件类型涵盖JSON、NT和GZ格式,主要包含转储信息说明、预览数据、压缩数据及转储配置规范等内容,是Wikidata知识库的结构化转储产物。

文件详解

  • 信息文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本信息
  • 预览文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:Wikidata转储的预览数据文件
  • 压缩数据文件
  • 文件名称:wdump-835.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩格式的Wikidata RDF转储数据文件
  • 配置规范文件
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、descriptions、entities、sitelinks、labels、version、meta、aliases等字段,记录转储工具的配置规范

适用场景

  • Wikidata知识库研究:用于分析Wikidata的结构化数据组织方式及转储规范
  • 语义网技术应用:基于RDF格式数据开展语义网相关技术的开发与测试
  • 数据转储工具验证:验证wdumps工具生成的Wikidata转储数据的完整性与规范性
  • 知识库数据备份研究:研究大规模知识库的数据备份与存储策略
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月12日
创建于 2026年2月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。