Wikidata_Dump_NA_RDF格式知识图谱数据

数据集概述

本数据集是通过wdumper工具生成的Wikidata的RDF格式转储数据,包含实体、陈述及三元组信息,总文件数4个,覆盖JSON、GZ压缩、NT等格式,可用于知识图谱相关的存储、查询与分析场景。

文件详解

  • 数据文件组(共2个)
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等配置字段
  • 压缩文件(共1个)
  • 文件名称:wdump-3322.nt.gz
  • 文件格式:GZ(压缩包)
  • 内容说明:压缩后的NT格式知识图谱数据文件
  • 预览文件(共1个)
  • 文件名称:preview.nt
  • 文件格式:NT
  • 内容说明:Wikidata RDF数据的预览文件

适用场景

  • 知识图谱存储与检索: 用于构建Wikidata知识图谱的本地存储库,支持实体、属性及关系的查询
  • 语义网技术研究: 基于RDF格式数据开展语义网建模、推理规则验证等技术研究
  • 知识工程应用开发: 为智能问答、推荐系统等知识驱动应用提供基础数据支撑
  • 数据格式转换实验: 用于测试RDF与其他数据格式的转换工具及流程优化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 328.98 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。