美国心脏病患者十年发病预测数据集USHeartPatients10-YearCHDPrediction-vijayandrew
数据来源:互联网公开数据
标签:心血管疾病, 风险预测, 机器学习, 健康大数据, 临床分析, 公共卫生, 流行病学, 数据挖掘
数据概述:
该数据集包含来自美国心脏病患者的健康信息,记录了用于预测个体十年内患冠心病(CHD)风险的结构化数据。主要特征如下:
时间跨度:数据未标明具体时间,通常被视为一个静态的、横断面数据集。
地理范围:数据主要涵盖美国心脏病患者。
数据维度:数据集包括性别(male)、年龄(age)、教育程度(education)、当前吸烟状况(currentSmoker)、每日吸烟量(cigsPerDay)、是否服用降压药(BPMeds)、是否曾患中风(prevalentStroke)、是否患高血压(prevalentHyp)、是否患糖尿病(diabetes)、总胆固醇(totChol)、收缩压(sysBP)、舒张压(diaBP)、身体质量指数(BMI)、心率(heartRate)、葡萄糖水平(glucose)以及十年内是否患冠心病(TenYearCHD)。
数据格式:CSV格式,文件名为US_Heart_Patients.csv,易于进行统计分析和机器学习建模。
该数据集适合用于心血管疾病风险预测、临床特征分析和公共卫生研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于心血管疾病风险预测模型的开发与评估,以及探索不同危险因素对冠心病发病风险的影响。
行业应用:为医疗健康行业提供数据支持,尤其在疾病风险评估、个性化健康管理、早期预警系统等方面具备实用价值。
决策支持:支持医疗机构和公共卫生部门制定预防策略、优化资源配置,以降低心血管疾病的发病率和死亡率。
教育和培训:作为医学、公共卫生、生物统计学等相关专业课程的实训材料,帮助学生理解疾病风险因素、学习数据分析方法。
此数据集特别适合用于探索心血管疾病与多种风险因素之间的关系,帮助用户构建预测模型,提升对个体患病风险的评估能力。