数据集概述
本数据集是通过wdumps工具生成的Wikidata RDF转储数据,包含实体子类相关信息。数据文件总数为4个,包含JSON、NT和GZ格式文件,记录了转储元数据、规格参数及实体相关RDF数据结构信息。
文件详解
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含转储元数据,键值包括id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount。
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:RDF数据预览文件,存储实体子类相关的三元组数据。
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含转储规格参数,键值包括labels、meta、statements、sitelinks、version、entities、aliases、descriptions。
- 文件名称:wdump-492.nt.gz
- 文件格式:GZ
- 字段映射介绍:压缩的RDF数据文件,存储实体子类相关的NT格式三元组数据。
数据来源
Wikidata(通过wdumps工具生成)
适用场景
- 语义网数据研究:用于分析Wikidata实体子类的RDF数据结构及语义关系。
- 知识图谱构建:提取实体子类相关信息,辅助知识图谱的构建与扩展。
- 数据转储工具测试:验证wdumps工具生成RDF数据的格式与完整性。
- 开放数据挖掘:挖掘Wikidata实体子类的属性、标签及描述等信息。