模拟MeSH层级数据集与庞加莱双曲距离

数据集概述

该数据集模拟了受MeSH词汇启发的一百万条生物医学概念层级关系,包含有效父子对和无关对。每条记录含概念ID、层级树编号、庞加莱嵌入空间的双曲距离得分及是否为真实后代的标签,用于生物医学本体的层级表示学习与分类研究。

文件详解

  • 文件名称: mesh_full_hierarchy_poincare_simulated.csv
  • 文件格式: CSV
  • 字段映射:
  • ParentUI: 父概念唯一ID
  • ChildUI: 子概念唯一ID
  • ParentTreeNumber: 父概念层级树编号
  • ChildTreeNumber: 子概念层级树编号
  • Distance_Hyperbolic: 双曲距离得分(0.01–0.4为有效对,0.8–2.0为无效对)
  • Is_Correct_Child: 子概念是否为真实层级后代(1为是,0为否)

数据来源

AURORA

适用场景

  • 生物医学本体层级关系建模研究
  • 庞加莱双曲嵌入空间在层级数据中的应用验证
  • 层级分类算法的训练与测试
  • 生物医学概念关系预测模型开发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 21.08 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。