数据集概述
本数据集是使用wdumper工具生成的Wikidata RDF导出测试数据(test1),包含4个文件,实体数、陈述数和三元组数均为0。数据用于验证wdumper工具的导出功能,涵盖配置文件、元数据文件、预览文件和压缩文件等类型,支持对Wikidata导出流程的测试与验证。
文件详解
- 元数据与配置文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、entities、samplingPercent、statements、sitelinks、labels、descriptions、aliases、languages、meta等配置字段
- 预览与压缩文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:Wikidata RDF导出的预览文件,当前三元组数为0
- 文件名称:wdump-2448.nt.gz
- 文件格式:GZ(压缩格式)
- 字段映射介绍:Wikidata RDF导出的压缩文件,包含NT格式数据
适用场景
- Wikidata导出工具测试: 验证wdumper工具生成RDF导出文件的功能正确性与格式规范性
- 语义网络数据处理测试: 用于测试RDF数据解析、存储和处理流程的兼容性
- 数据导出配置验证: 通过wdumper-spec.json验证导出参数配置的有效性
- 元数据管理测试: 基于info.json测试元数据记录与管理流程的完整性