合成中风预测数据集

数据集概述

该数据集为人工生成的合成中风预测数据,包含五万条记录和十二个特征,目标变量为二分类的中风发生情况。数据含数值与分类特征,部分条目有缺失值,适用于机器学习分类、医疗分析及数据预处理练习,未使用真实患者信息。

文件详解

  • 文件名称: synthetic_stroke_data.csv
  • 文件格式: CSV (.csv)
  • 字段映射:
  • id: 样本唯一标识
  • gender: 性别
  • age: 年龄
  • hypertension: 是否患高血压(0/1)
  • heart_disease: 是否患心脏病(0/1)
  • ever_married: 是否已婚(Yes/No)
  • work_type: 工作类型
  • Residence_type: 居住类型(Urban/Rural)
  • avg_glucose_level: 平均血糖水平
  • bmi: 体重指数
  • smoking_status: 吸烟状态
  • stroke: 中风发生情况(0=无,1=有)

适用场景

  • 机器学习教学: 用于分类模型训练、评估与优化练习
  • 医疗数据分析: 模拟中风风险因素与预测模型构建
  • 数据预处理实践: 缺失值处理、特征编码等数据清洗技术应用
  • 医疗AI研究: 探索医疗特征与中风发生的关联模式
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。