Wikidata_Dump_RDF格式知识图谱数据转储

数据集概述

本数据集是通过wdumps工具生成的Wikidata的RDF格式转储数据,包含实体、陈述和三元组等信息,总文件数4个,涵盖JSON、NT和GZ等格式,可用于知识图谱相关的研究与应用。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段
  • preview.nt
  • 文件格式:NT
  • 字段映射介绍:N-Triples格式的预览数据
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含version、labels、entities、meta、aliases、sitelinks、descriptions、statements等字段
  • wdump-1020.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩的N-Triples格式数据

适用场景

  • 知识图谱研究: 用于分析和构建知识图谱,研究知识表示与存储
  • 语义网技术开发: 支持语义网相关的应用开发与技术验证
  • 数据挖掘与分析: 挖掘Wikidata中的实体关系和知识模式
  • 自然语言处理: 为自然语言处理任务提供结构化的知识资源
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。