Wikidata_Dump_Based知识图谱RDF导出数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF导出数据,包含实体、声明、三元组等结构化信息,共4个文件,涵盖JSON、NT、GZ等格式,支持对Wikidata数据的解析与应用。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF三元组预览文件,记录资源描述框架的基础数据结构
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta等结构化定义字段
  • wdump-1057.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩格式的RDF三元组数据文件,存储完整的Wikidata导出三元组信息

适用场景

  • 知识图谱构建: 利用RDF三元组数据搭建或扩展知识图谱系统
  • 语义网研究: 分析Wikidata的RDF结构与数据组织方式
  • 数据解析工具开发: 基于JSON元数据和NT数据格式,开发Wikidata数据的解析与处理工具
  • 知识工程应用: 提取Wikidata中的实体、标签、声明等信息,支持智能问答、信息检索等应用
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月8日
创建于 2026年2月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。