异基因造血干细胞移植预后预测数据集AllogeneicHematopoieticStemCellTransplantationPrognosisPredictionDataset-zhanghail
数据来源:互联网公开数据
标签:造血干细胞移植, 预后预测, 机器学习, 生存分析, 医学研究, 临床数据, 风险评估, 疾病预测
数据概述:
该数据集包含异基因造血干细胞移植(allo-HCT)患者的临床数据,旨在用于预测移植后的预后。主要特征如下:
时间跨度:数据未明确标注具体时间范围,推测为一段时间内收集的临床病例。
地理范围:数据来源未明确,但涵盖了allo-HCT相关的临床数据,可能来自于多个医疗机构。
数据维度:数据集包括多个特征,涵盖患者的临床病史、移植相关因素、HLA匹配情况、合并症、治疗方案等。主要字段包括ID、各种评分(如dri_score、cyto_score等)、既往病史、HLA匹配情况、移植类型、CMV状态、用药情况、民族、移植年份、合并症、Karnofsky评分等。此外,train.csv文件还包含“efs”(无事件生存)和“efs_time”(无事件生存时间)作为预测目标。
数据格式:数据集以CSV格式提供,包含两个文件:train.csv(训练集)和test.csv(测试集),便于数据分析和模型训练。数据已进行预处理,包括对缺失值的处理。
该数据集适合用于研究和开发预测allo-HCT患者预后的机器学习模型。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于医学研究,特别是移植医学领域,用于探索影响allo-HCT患者预后的关键因素,并开发预测模型。
行业应用:为医疗机构提供数据支持,用于风险评估、患者分层和个性化治疗方案的制定,提高移植成功率。
决策支持:支持医生和医疗团队做出更明智的临床决策,改善患者管理和预后。
教育和培训:作为医学、生物统计学、数据科学等相关专业课程的辅助材料,用于教学和实践。
此数据集特别适合用于探索allo-HCT患者的生存规律,评估不同因素对预后的影响,帮助用户构建预测模型,从而优化临床决策,改善患者生存率。