Wikidata_Based_RDF格式知识库数据

数据集概述

本数据集为Wikidata的RDF格式数据转储,由wdumps工具生成。包含实体、陈述和三元组等核心数据,提供info.json、wdumper-spec.json等配置文件及RDF数据文件,总计4个文件,支持对Wikidata知识库数据的访问与使用。

文件详解

  • 配置文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录数据转储的基础信息。
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta、languages等字段,定义数据转储的规范参数。
  • 数据文件
  • 文件名称:wdump-1055.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩格式的RDF数据文件,存储Wikidata的三元组数据。
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:RDF数据预览文件,以N-Triples格式存储部分数据内容。

适用场景

  • 知识库研究: 用于分析Wikidata知识库的结构、实体关系及数据覆盖范围。
  • 语义网技术应用: 基于RDF格式数据,开展语义网相关的技术开发与应用测试。
  • 数据转储工具评估: 针对wdumps工具生成的RDF数据,评估其数据完整性与格式规范性。
  • 知识图谱构建: 利用Wikidata的三元组数据,辅助构建特定领域的知识图谱。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。