Wikidata_dump1_Based_RDF格式转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据(dump1),包含实体、声明、三元组等语义网络信息,共4个文件,涵盖JSON配置文件、预览文件及压缩数据文件。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、descriptions、version、entities、statements、languages、meta、aliases、sitelinks等配置字段
  • preview.nt
  • 文件格式:NT
  • 内容介绍:RDF三元组预览文件
  • wdump-233.nt.gz
  • 文件格式:GZ
  • 内容介绍:压缩的RDF三元组数据文件

适用场景

  • 语义网络研究:用于分析Wikidata的实体关系、属性结构等语义网络特征
  • 数据转储技术验证:测试wdumps工具生成RDF转储的完整性和格式规范性
  • 知识库构建:作为Wikidata数据的补充来源,支持特定领域知识库的构建
  • 数据格式转换研究:对比分析RDF与其他格式(如JSON)在语义数据存储中的差异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 196.04 MiB
最后更新 2026年2月8日
创建于 2026年2月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。