GeoVectors_Based_OpenStreetMap实体语义地理双维度嵌入知识图谱数据_v1_0

数据集概述

本数据集是基于2020年11月10日OpenStreetMap快照构建的大规模链接开放语料库,包含超过9亿个实体的语义(-tags)和地理(-location)双维度嵌入表示,支持机器学习应用直接调用。数据集按区域划分子集,配套知识图谱关联Wikidata、DBpedia等权威源,可定位特定实体所属子集。

文件详解

  • 文件名称:geovec-s.nt
  • 文件格式:NT
  • 字段映射介绍:RDF三元组格式,存储GeoVectors知识图谱的核心关联数据,包含实体、属性与值的语义链接关系
  • 文件名称:void.ttl
  • 文件格式:TTL
  • 字段映射介绍:RDF词汇表格式,描述数据集的技术元数据,如数据规模、分布、关联数据源等
  • 文件名称:geovectors-kg.nt.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩归档文件,包含完整的GeoVectors知识图谱NT格式数据,用于存储和传输大规模三元组信息

数据来源

OpenStreetMap 2020年11月10日快照(© OpenStreetMap contributors)

适用场景

  • 地理实体语义分析: 利用-tags嵌入挖掘OpenStreetMap实体的语义关联与类别特征
  • 地理空间模式识别: 通过-location嵌入分析实体的空间分布规律与区域特征
  • 跨源地理数据融合: 借助知识图谱关联Wikidata、DBpedia,实现多源地理信息整合
  • 机器学习模型训练: 为地理信息相关的分类、聚类、推荐等机器学习任务提供预训练嵌入
  • 区域地理研究: 基于分区域子集分析不同大洲/国家的地理实体特征与分布差异
  • 智能地理检索: 利用语义+地理双维度嵌入提升地理信息检索的精准度与召回率
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 237.52 MiB
最后更新 2026年1月1日
创建于 2026年1月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。