数据集概述
本数据集是通过wdumper工具生成的Wikidata RDF转储,包含带有Joconde ID的艺术品数据。Joconde是法国文化遗产艺术品数据库,数据集共含18099个实体、374647条陈述和484207个三元组,涉及4个文件,可用于获取法国文化遗产艺术品的结构化关联数据。
文件详解
- 信息文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基本元数据信息。
- 预览文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF三元组预览文件,以N-Triples格式存储艺术品关联数据。
- 压缩数据文件
- 文件名称:wdump-3269.nt.gz
- 文件格式:GZ(压缩的NT文件)
- 字段映射介绍:压缩的RDF三元组数据文件,包含完整的艺术品关联数据。
- 转储配置文件
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等字段,记录wdumper工具的配置参数。
数据来源
Wikidata(通过wdumper工具生成,关联Joconde数据库)
适用场景
- 文化遗产数据整合:用于整合法国Joconde数据库与Wikidata的艺术品信息,构建结构化文化遗产数据集。
- 艺术品关联分析:通过RDF三元组分析艺术品的属性、分类及关联关系。
- 文化遗产研究:支持法国文化遗产艺术品的统计分析、分布研究等学术工作。
- 数据转储技术验证:作为wdumper工具生成RDF转储的案例,用于评估转储工具的性能与数据完整性。