Wikidata_Based_RDF格式转储数据_原始

数据集概述

本数据集为通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、陈述及三元组信息,当前实体、陈述和三元组计数均为零。数据集共4个文件,涵盖JSON配置文件、预览文件及压缩数据文件,可用于Wikidata数据的解析与应用。

文件详解

  • 配置与信息文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储工具版本、日期及数据计数信息
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含labels、meta、statements、sitelinks、version、entities、aliases、descriptions等键,定义Wikidata数据的结构规范
  • 数据文件
  • 文件名称:preview.nt
  • 文件格式:NT(N-Triples)
  • 字段映射介绍:RDF三元组预览文件,当前实体、陈述及三元组计数均为零
  • 文件名称:wdump-417.nt.gz
  • 文件格式:GZ(压缩文件)
  • 字段映射介绍:压缩的RDF三元组数据文件,当前实体、陈述及三元组计数均为零

适用场景

  • 知识图谱研究:用于解析Wikidata RDF数据结构,支持知识图谱构建与分析
  • 数据格式转换测试:验证RDF格式与其他数据格式的转换逻辑及工具性能
  • 数据处理工具开发:基于配置文件结构,开发Wikidata数据的解析与处理工具
  • 语义网技术应用:探索RDF三元组数据在语义网场景中的存储与查询方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.38 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。