数据集概述
本数据集是通过wdumps工具生成的Wikidata物理相关内容的RDF格式测试转储数据,包含4个文件,实体数、陈述数和三元组数均为0,用于测试RDF转储流程的有效性。
文件详解
- 配置与元数据文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含statements、labels、version、sitelinks、meta、aliases、descriptions、entities等配置字段
- 数据文件
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF格式的预览数据文件
- 文件名称:wdump-155.nt.gz
- 文件格式:GZ压缩文件
- 字段映射介绍:压缩的RDF格式转储数据文件
数据来源
Wikidata
适用场景
- RDF数据转储工具测试: 验证wdumps工具生成Wikidata RDF转储的流程正确性
- 语义网络数据处理测试: 用于测试系统对RDF格式数据的读取、解析能力
- 数据格式兼容性测试: 验证不同系统对NT格式、JSON格式及压缩文件的兼容性
- 元数据管理流程测试: 测试元数据字段(如版本、日期、计数)的生成和记录逻辑