数据集概述
本数据集是Wikidata中“食物子类”相关的RDF转储数据,由wdumps工具生成。包含2829个实体、21710条陈述和255356条三元组,共4个文件,涵盖实体信息、陈述数据及元数据等内容,为食物分类知识图谱研究提供结构化数据支持。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF三元组预览文件,包含食物子类相关的主体-谓词-客体三元组数据
- 文件名称:wdump-1713.nt.gz
- 文件格式:GZ压缩包(内含NT文件)
- 字段映射介绍:压缩后的RDF三元组数据文件,存储食物子类相关的完整三元组内容
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含meta、sitelinks、descriptions、labels、aliases、statements、entities、version、samplingPercent等配置字段
数据来源
Wikidata(通过wdumps工具生成)
适用场景
- 知识图谱构建: 用于构建食物分类领域的知识图谱,支持实体关系分析
- 语义网研究: 作为RDF格式的开放数据,用于语义网技术、三元组存储与查询的研究
- 食物分类分析: 分析Wikidata中食物子类的层级结构与属性关系
- 数据挖掘: 挖掘食物实体的标签、描述、别名及陈述数据,支持食物领域的智能应用开发