数据集概述
本数据集是通过wdumps工具生成的Wikidata RDF Dump,聚焦韩国的企业与企业家相关实体。包含4个文件,覆盖元数据、规格说明、预览数据及压缩数据文件,可用于获取韩国企业与企业家的结构化关联数据。
文件详解
- 元数据文件:
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 规格说明文件:
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含languages、sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等规格配置字段
- 预览数据文件:
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF格式的预览数据文件
- 压缩数据文件:
- 文件名称:wdump-2073.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩的RDF N-Triples格式数据文件
数据来源
Wikidata(通过wdumps工具生成)
适用场景
- 韩国企业信息分析: 用于提取和分析韩国企业的基本信息及关联数据
- 企业家研究: 支撑韩国企业家相关实体的关联关系研究
- 企业数据关联分析: 基于RDF数据结构进行企业与企业家的关联关系挖掘
- 企业信息系统构建: 为企业信息查询系统提供结构化的韩国企业数据支撑