语义网络_Wikidata知识图谱数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、陈述和三元组等信息的结构化记录。数据集总计四个文件,涵盖JSON配置文件、压缩的N-Triples数据文件及预览文件,为知识图谱相关研究提供基础数据支持。

文件详解

  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本元信息
  • 文件名称:wdump-629.nt.gz
  • 文件格式:GZ(压缩包)
  • 字段映射介绍:压缩的N-Triples格式数据文件,包含Wikidata的三元组数据
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、meta、entities、statements、sitelinks、labels、aliases、descriptions等字段,定义转储的规格配置
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:N-Triples格式的预览数据文件,提供数据内容的示例

适用场景

  • 知识图谱构建与分析: 用于语义网络、知识表示等领域的研究与应用开发
  • 数据挖掘与语义分析: 基于Wikidata的实体和三元组数据开展关联分析
  • 工具开发测试: 为wdumps等知识图谱转储工具提供测试数据支持
  • 学术研究: 支持知识工程、自然语言处理等领域的学术研究工作
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 580.1 MiB
最后更新 2026年2月10日
创建于 2026年2月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。