知识库数据_Wikidata_RDF导出数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF导出数据,包含4个文件,文件类型涵盖JSON、NT和GZ格式。数据涉及实体、陈述和三元组的统计信息,以及导出工具的配置规范,为知识图谱相关研究和应用提供基础数据支持。

文件详解

  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录导出数据的基本信息。
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF格式的预览数据文件,包含知识图谱的三元组信息。
  • 文件名称:wdump-1477.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩的RDF数据文件,存储Wikidata的三元组信息。
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、aliases、version、statements、entities、descriptions、samplingPercent、labels、meta等字段,记录导出工具的配置规范。

适用场景

  • 知识图谱构建与分析: 用于构建和分析Wikidata知识图谱的结构和内容。
  • 语义网研究: 支持语义网相关的技术研究和应用开发。
  • 数据挖掘与分析: 挖掘Wikidata中的实体、属性和关系信息,进行数据分析。
  • 知识库应用开发: 为基于Wikidata的知识库应用提供数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。