数据集概述
本数据集为Wikidata平台上SNOMED CT元数据的RDF导出数据,由wdumps工具生成。包含元数据文件、导出规范文件、RDF数据文件及预览文件,共4个文件,虽当前实体、声明、三元组计数均为0,但提供了完整的导出结构和元数据框架。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount字段,记录导出工具版本、导出日期及数据计数等元信息
- wdump-1064.nt.gz
- 文件格式:GZ压缩包(内部为N-Triples格式文件)
- 字段映射介绍:Wikidata SNOMED CT元数据的RDF数据压缩文件,N-Triples格式用于存储资源描述框架三元组
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含sitelinks、entities、labels、statements、version等字段,定义Wikidata导出工具的配置规范
- preview.nt
- 文件格式:N-Triples
- 字段映射介绍:SNOMED CT元数据RDF数据的预览文件,N-Triples格式存储三元组数据
数据来源
Wikidata平台(由wdumps工具生成)
适用场景
- 知识图谱元数据研究:分析Wikidata导出元数据的结构与规范,探索医疗领域知识图谱的构建方法
- 医疗术语标准化研究:基于SNOMED CT元数据框架,研究医疗术语的标准化存储与关联方式
- RDF数据格式分析:通过N-Triples格式文件,学习RDF数据的存储结构与解析方法
- 数据导出工具配置研究:基于wdumper-spec.json,研究Wikidata数据导出工具的配置逻辑与参数设置