Wikidata_Dump_Based维基数据RDF转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF转储数据,包含实体、陈述和三元组信息的结构化记录,共包含4个文件,涵盖JSON、NT、GZ等格式,可用于语义网相关的数据分析与应用。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等键值对,记录转储的基础元信息
  • preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF三元组格式的预览文件,记录实体间的语义关系数据
  • wdump-115.nt.gz
  • 文件格式:GZ(压缩包)
  • 字段映射介绍:压缩后的RDF三元组数据文件,包含结构化的实体与关系信息
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含statements、labels、version、languages、sitelinks、meta、aliases、descriptions、entities等键值对,记录转储工具的配置规范

适用场景

  • 语义网研究:用于分析Wikidata的RDF数据结构与语义关系模型
  • 知识图谱构建:基于转储数据提取实体、属性和关系,支撑知识图谱相关应用
  • 数据挖掘:通过解析RDF三元组,挖掘实体间的关联规则与潜在模式
  • 工具开发验证:作为测试数据,验证WDumper等RDF转储工具的功能与性能
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。