数据集概述
本数据集是通过wdumps工具生成的Wikidata电影测试RDF转储数据,包含4个文件,涵盖配置说明、预览数据、压缩数据等类型,无实际实体、陈述及三元组内容,用于测试转储流程或工具验证。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录转储的基础信息。
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF预览文件,无实际数据内容。
- 文件名称:wdump-1078.nt.gz
- 文件格式:GZ(压缩NT文件)
- 字段映射介绍:压缩的RDF转储文件,无实际数据内容。
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含sitelinks、entities、labels、statements、version、aliases、descriptions、meta等键的配置文件,定义转储规格。
数据来源
Wikidata(通过wdumps工具生成)
适用场景
- 知识图谱工具测试:用于验证RDF转储工具、解析工具的功能完整性和兼容性。
- 转储流程验证:测试Wikidata数据转储流程的正确性,确保各环节输出符合预期。
- 数据格式学习:作为RDF(NT格式)、JSON配置文件的示例数据,用于相关格式的学习和研究。
- 系统集成测试:在知识图谱相关系统开发中,用于模拟Wikidata转储数据的输入场景。