弗雷明汉心脏病风险预测数据集FraminghamHeartStudyRiskPredictionDataset-tatianadubs
数据来源:互联网公开数据
标签:心血管疾病, 风险预测, 机器学习, 医疗健康, 流行病学, 数据分析, 临床预测, 风险评估
数据概述:
该数据集包含来自弗雷明汉心脏研究的数据,记录了参与者的多种健康指标,旨在用于预测个体在未来十年内患冠心病的风险。主要特征如下:
时间跨度:数据未明确标明时间范围,但基于弗雷明汉心脏研究的背景,可推测为长期随访数据。
地理范围:数据来源于美国马萨诸塞州弗雷明汉市的居民。
数据维度:数据集包括多个与心血管健康相关的变量,例如:性别(male)、年龄(age)、教育程度(education)、吸烟情况(currentSmoker, cigsPerDay)、血压药物使用情况(BPMeds)、既往中风史(prevalentStroke)、高血压史(prevalentHyp)、糖尿病史(diabetes)、总胆固醇(totChol)、收缩压(sysBP)、舒张压(diaBP)、体重指数(BMI)、心率(heartRate)、血糖(glucose),以及十年内发生冠心病的指标(TenYearCHD)。
数据格式:CSV格式,文件名为framingham.csv,方便数据分析和建模。
数据来源:数据来源于弗雷明汉心脏研究,该研究经过了严格的伦理审查和数据收集流程。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于心血管疾病风险因素分析、预测模型构建、以及流行病学研究,例如探索不同风险因素对心血管疾病发生的影响。
行业应用:可用于医疗健康行业,例如开发心血管疾病风险评估工具,辅助医生进行临床决策,以及用于保险行业的风险定价。
决策支持:支持医疗机构和公共卫生部门制定心血管疾病预防策略,优化医疗资源配置。
教育和培训:作为医学、公共卫生、生物统计学等相关专业课程的实训材料,帮助学生理解心血管疾病风险预测模型。
此数据集特别适合用于构建和评估心血管疾病风险预测模型,例如逻辑回归、支持向量机、决策树等,从而帮助用户实现对心血管疾病风险的早期识别和干预。