医疗健康模拟患者数据-数据分析与机器学习实践数据集-usmankha
数据来源:互联网公开数据
标签:医疗健康,患者数据,模拟数据,数据分析,机器学习,数据可视化,医疗,教育
数据概述:
本数据集包含51,000条模拟患者记录,由Python编程和Faker库生成。数据集旨在用于教育和研究目的,特别适用于数据分析、机器学习和数据可视化技术的实践。
数据集字段包括:
Patient_ID(患者ID):每位患者的唯一标识符。
Age(年龄):患者年龄,以年为单位(18-89岁)。
Gender(性别):患者性别(男、女、其他)。
Blood_Pressure_Systolic/Diastolic(收缩压/舒张压):血压测量值,单位为mmHg。
Heart_Rate(心率):心率,单位为每分钟心跳次数(BPM)。
Cholesterol_Level(胆固醇水平):胆固醇水平,单位为mg/dL。
Medical_Conditions(医疗状况):常见的医疗状况,如糖尿病、高血压、哮喘或无。
Medications(药物):药物类型,包括二甲双胍、赖诺普利、他汀类药物或无。
Visit_Date(就诊日期):最近一次医疗就诊的日期(当年)。
Diagnosis(诊断):医疗诊断类型(常规检查、感染、急诊、复诊)。
Hospital_Visits_Past_Year(过去一年的住院次数):过去一年内的住院次数(0-9次)。
BMI(身体质量指数):身体质量指数(18.5至35)。
Smoker_Status(吸烟状态):患者是否吸烟(是/否)。
Physical_Activity_Level(身体活动水平):患者的身体活动水平(久坐、中等、活跃)。
数据用途概述:
该数据集主要用于教育和实践,特别适用于:
数据分析和数据可视化
机器学习模型的训练和评估
数据预处理实践
局限性:
这组数据是模拟数据,不应用于临床决策或专业的医疗保健分析。
许可:
在知识共享署名4.0国际许可协议下,该数据集可被自由用于非商业用途。