数据集概述
本数据集为OMOP2OBO疾病事件映射数据V1.0,包含OMOP标准临床术语(SNOMED CT)与Human Phenotype Ontology(HPO)、Mondo本体的映射关系。映射通过OMOP2OBO算法自动生成或人工创建,经UMLS语义类型过滤后,采用TF-IDF词袋模型、余弦相似度计算等方法构建,支持医疗数据的语义与临床互操作。
文件详解
- 文件名称:
OMOP2OBO_V1.5_Condition_Occurrence_Mapping_Oct2020.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含OMOP疾病事件概念与HPO、Mondo本体的映射关系,涵盖映射类别(自动一对一/一对多概念/祖先、人工一对一/一对多、余弦相似度、未映射)、相似度得分等信息,记录不同映射方式下的术语关联。
数据来源
OMOP2OBO mapping algorithm及相关资源(GitHub: OMOP2OBO、Project Wiki: OMOP2OBO - wiki、Zenodo Community: OMOP2OBO、Preprint Manuscript: 10.5281/zenodo.5716421)
适用场景
- 医疗数据标准化:实现OMOP临床术语与生物医学本体的语义映射,提升跨系统数据互操作性。
- 生物医学研究:支持疾病表型、疾病分类的本体关联分析,助力精准医学研究。
- 医疗术语体系整合:为临床数据与生物医学本体的融合提供结构化映射参考。
- 医疗AI模型训练:作为术语映射基准数据,优化医疗自然语言处理或知识图谱构建模型。