Wikidata_Based_奥运会相关数据Dump_数据集

数据集概述

本数据集是通过wdumps工具生成的Wikidata奥运会相关RDF dump数据,包含与奥运会相关的结构化信息。数据集共4个文件,涵盖配置说明、预览数据、压缩数据及规格文件,可用于获取奥运会相关的实体、陈述及三元组信息。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等字段,记录数据集的基本元信息。
  • preview.nt
  • 文件格式:NT
  • 字段映射介绍:奥运会相关数据的预览文件,以三元组形式存储基础信息。
  • wdump-1716.nt.gz
  • 文件格式:GZ
  • 字段映射介绍:压缩格式的奥运会相关RDF数据文件,包含核心数据集内容。
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含meta、sitelinks、descriptions、labels、aliases、statements、entities、version、samplingPercent等字段,记录数据集的生成规格配置。

适用场景

  • 奥运会信息集成分析: 整合Wikidata中奥运会相关的实体、标签、描述等信息,支持多维度分析。
  • 知识图谱构建: 利用RDF格式数据构建奥运会领域知识图谱,关联赛事、运动员、场馆等实体关系。
  • 数据挖掘研究: 基于数据集的三元组信息,挖掘奥运会相关的潜在关联规则与知识模式。
  • 语义网应用开发: 为奥运会主题的语义网应用提供结构化数据支撑,实现智能检索与知识推理。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。