Mondo_Based_罕见病叶节点术语完整统计数据

数据集概述

该数据集基于Mondo疾病本体2019-09-30版本,通过筛选疾病术语、排除疾病易感性术语、识别罕见病标签及gard_rare子集等步骤,最终统计出本体中符合条件的罕见病叶节点术语数量,为回答“罕见病有多少种”的问题提供数据支持。

文件详解

  • README.txt:文本格式,包含数据集分析背景、方法步骤及结果概述,解释数据统计逻辑。
  • all-mondo-disease-terms.tsv:TSV格式,包含21633条Mondo疾病术语,字段包括class、class_label、synonyms、GARD、NCIT、OMIM、DOID、Orphanet、is_gard_rare、is_mondo_rare、is_rare、is_leaf等,记录疾病术语及罕见病、叶节点标识。
  • unique-rare-disease-concepts-recorded-in-different-knowledge-sources.pdf:PDF格式,可能包含不同知识源中罕见病概念的记录信息。

适用场景

  • 罕见病流行病学研究:统计罕见病数量及分类分布
  • 疾病本体构建:完善Mondo疾病本体中罕见病术语体系
  • 罕见病数据库整合:对比不同知识源(如GARD、OMIM)的罕见病记录差异
  • 医疗数据标准化:为医疗系统罕见病术语统一提供参考
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.12 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。