哥伦比亚大学疾病症状知识数据库处理版

哥伦比亚大学疾病症状知识数据库处理版 数据来源:互联网公开数据 标签:疾病,症状,知识图谱,数据增强,医学分析,健康研究,机器学习 数据概述: 本数据集是基于哥伦比亚大学提供的原始疾病症状知识数据库进行处理后的结果,收录了134种疾病及其对应的405种症状。原始数据集中包含150种疾病,由于存在重复标注,经过处理后缩减至134种。每种疾病最初仅有一个示例,通过数据增强技术(num_augmentations=100),增加了数据量并提升了数据多样性,同时去除了数据集中的重复项。此外,将原始数据集中一个空白数据项重命名为“结核菌素试验阳性”(UMLS:C0032739),并在HIV感染疾病中进行了标注。 数据用途概述: 该数据集适用于医学研究、健康数据分析、疾病预测建模等多种场景。研究人员可以利用此数据集进行疾病与症状关联分析,探索疾病的发展模式;医疗机构可以借助数据提高疾病诊断的准确性;数据科学家可以使用数据集训练机器学习模型,提升疾病预测能力。此外,数据集也适合用于教育培训,帮助学习者理解疾病症状知识图谱的构建与应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.14 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。