Wikidata_Dump_企业信息RDF转储基础数据

数据集概述

本数据集是使用wdumps工具生成的Wikidata企业信息RDF转储,包含企业相关数据的基础文件,涵盖配置信息、元数据及数据预览等内容,共包含4个文件,支持企业信息的知识图谱构建与分析。

文件详解

  • 文件名称:info.json 文件格式:JSON 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段,记录转储的基础信息。
  • 文件名称:wdumper-spec.json 文件格式:JSON 字段映射介绍:包含languages、sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等配置字段,定义转储的参数与结构。
  • 文件名称:wdump-2074.nt.gz 文件格式:GZ压缩文件 字段映射介绍:Wikidata企业数据的RDF转储压缩文件,存储企业相关的三元组数据。
  • 文件名称:preview.nt 文件格式:NT 字段映射介绍:企业数据转储的预览文件,提供数据内容的示例展示。

数据来源

Wikidata(通过wdumps工具生成)

适用场景

  • 知识图谱构建: 利用RDF转储数据构建企业信息知识图谱,支持企业关系与属性的关联分析。
  • 企业数据挖掘: 基于转储的企业信息,挖掘企业行业分布、关联关系等数据价值。
  • 语义网研究: 用于研究RDF数据格式在企业信息存储与检索中的应用。
  • 数据转储工具测试: 作为wdumps工具生成的转储示例,支持工具功能验证与优化。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 234.38 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。