知识库数据_Wikidata人类实体数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata人类实体RDF转储数据,包含所有人类实体的相关信息。数据以多种文件格式呈现,可用于知识图谱构建、语义分析等场景,共包含4个文件。

文件详解

  • 配置与元数据文件
  • 文件名称:info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • 文件名称:wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含descriptions、entities、aliases、labels、meta、sitelinks、version、statements等结构定义字段
  • 预览数据文件
  • 文件名称:preview.nt
  • 文件格式:NT
  • 字段映射介绍:人类实体RDF数据预览文件
  • 压缩数据文件
  • 文件名称:wdump-708.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩格式的人类实体RDF转储数据文件

适用场景

  • 知识图谱构建: 用于构建包含人类实体的知识图谱,支持语义查询和关联分析
  • 语义网络研究: 分析人类实体之间的关系和属性,探索知识组织模式
  • 数据挖掘与分析: 挖掘人类实体的特征和分布规律,支持相关领域研究
  • 知识库系统开发: 作为基础数据支撑,开发基于Wikidata的应用系统
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。