数据集概述
本数据集是针对Wikidata中法国政治人物的RDF数据转储,通过wdumps工具生成。包含4个文件,涵盖数据元信息、配置规范、预览数据及压缩数据,为语义网相关研究提供结构化数据支持。
文件详解
- info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等数据元信息字段
- wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含languages、sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等配置规范字段
- preview.nt
- 文件格式:NT
- 字段映射介绍:RDF预览数据文件,包含法国政治人物相关的三元组数据
- wdump-2061.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩的RDF数据文件,存储法国政治人物的完整三元组数据
数据来源
Wikidata
适用场景
- 语义网数据研究:用于分析RDF格式数据的结构和组织方式
- 法国政治人物知识图谱构建:基于转储数据构建法国政治人物领域的知识图谱
- 数据转储工具验证:测试wdumps工具生成RDF数据的完整性和准确性
- 多语言数据处理:通过配置规范中的语言字段研究多语言数据的存储和处理方式