数据集概述
本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,主题聚焦于drinks_all相关实体。包含39个实体、229条陈述和2754个三元组,以多种格式存储,为Wikidata知识库中饮品相关信息的研究和应用提供结构化数据支持。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录数据转储的基础元信息。
- preview.nt
- 文件格式:NT
- 字段映射介绍:RDF三元组格式的预览文件,包含饮品相关实体的结构化数据陈述。
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含meta、sitelinks、descriptions、labels、languages、aliases、statements、entities、version、samplingPercent等字段,记录数据转储的配置规范。
- wdump-1710.nt.gz
- 文件格式:GZ压缩包
- 字段映射介绍:压缩后的RDF三元组数据文件,存储完整的饮品相关实体转储数据。
适用场景
- Wikidata知识库研究:用于分析Wikidata中饮品相关实体的结构、属性及关系。
- 语义网数据应用:基于RDF三元组数据构建饮品领域的语义应用或知识图谱。
- 数据转储技术研究:通过info.json和wdumper-spec.json分析Wikidata转储工具的配置和元数据规范。
- 饮品领域知识挖掘:从实体和陈述数据中提取饮品相关的分类、属性等知识,支持领域研究和应用开发。