数据集概述
本数据集是通过wdumps工具生成的Wikidata企业信息RDF转储数据,包含四件文件,涵盖数据元信息、转储配置、RDF数据压缩包及预览文件,为Wikidata企业实体信息的获取与分析提供结构化资源。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等数据元信息字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含languages、sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等转储配置字段
- 文件名称:wdump-2072.nt.gz
- 文件格式:GZ压缩包
- 字段映射介绍:Wikidata企业信息的RDF数据压缩文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:Wikidata企业信息的RDF数据预览文件
适用场景
- 知识图谱构建: 用于企业信息知识图谱的构建与扩展,整合Wikidata企业实体数据
- 数据转储技术研究: 分析wdumps工具生成RDF转储数据的格式与结构特点
- 企业信息分析: 基于转储数据开展企业实体属性、关系等信息的统计与分析
- 语义网应用开发: 为语义网相关应用提供结构化的企业RDF数据支持