OMOP2OBO_Source_医疗术语与生物医学本体映射数据V1_0

数据集概述

本数据集为OMOP2OBO疾病事件映射数据V1.0,包含OMOP标准临床术语(SNOMED CT)与Human Phenotype Ontology(HPO)、Mondo本体的映射关系。映射通过OMOP2OBO算法自动生成或人工创建,经UMLS语义类型过滤后,采用TF-IDF词袋模型、余弦相似度计算等方法构建,支持医疗数据的语义与临床互操作。

文件详解

  • 文件名称:OMOP2OBO_V1.5_Condition_Occurrence_Mapping_Oct2020.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含OMOP疾病事件概念与HPO、Mondo本体的映射关系,涵盖映射类别(自动一对一/一对多概念/祖先、人工一对一/一对多、余弦相似度、未映射)、相似度得分等信息,记录不同映射方式下的术语关联。

数据来源

OMOP2OBO mapping algorithm及相关资源(GitHub: OMOP2OBO、Project Wiki: OMOP2OBO - wiki、Zenodo Community: OMOP2OBO、Preprint Manuscript: 10.5281/zenodo.5716421)

适用场景

  • 医疗数据标准化:实现OMOP临床术语与生物医学本体的语义映射,提升跨系统数据互操作性。
  • 生物医学研究:支持疾病表型、疾病分类的本体关联分析,助力精准医学研究。
  • 医疗术语体系整合:为临床数据与生物医学本体的融合提供结构化映射参考。
  • 医疗AI模型训练:作为术语映射基准数据,优化医疗自然语言处理或知识图谱构建模型。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 90.18 MiB
最后更新 2026年1月26日
创建于 2026年1月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。