数据集概述
该数据集包含社会人口学、母婴健康等变量,用于预测儿童死亡率(二分类:零为存活,一为死亡)。核心变量涵盖母亲年龄、父亲年龄、出生体重、产前检查次数、机构分娩情况等,目标变量为死亡率,适用于通过机器学习模型进行风险预测分析。
文件详解
- 文件名称: Child Mortality Risk Factor Dataset/child_mortality_dataset.csv
- 文件格式: CSV
- 字段说明:
- mother_age: 母亲年龄(数值型)
- father_age: 父亲年龄(数值型)
- birth_order: 出生顺序(数值型)
- birth_weight: 出生体重(数值型,单位:千克)
- mother_education: 母亲教育水平(分类变量:无/小学/中学/高等)
- wealth_index: 财富指数(分类变量:贫困/中等/富裕)
- residence: 居住地区(分类变量:城市/农村)
- antenatal_visits: 产前检查次数(数值型)
- institutional_delivery: 机构分娩情况(二分类:是/否)
- vaccination_status: 疫苗接种情况(二分类:是/否)
- access_to_water: 清洁用水获取情况(二分类:是/否)
- toilet_facility: 卫生设施使用情况(二分类:是/否)
- low_birth_interval: 低生育间隔(二分类:是/否)
- mortality: 死亡率(目标变量,二分类:零/一)
适用场景
- 公共卫生研究: 分析儿童死亡率的关键影响因素,识别高风险群体
- 医疗政策制定: 为改善母婴健康服务(如产前检查、疫苗接种)提供数据支持
- 机器学习应用: 构建儿童死亡率预测模型(如逻辑回归、决策树)
- 社会经济分析: 探究教育水平、财富状况等社会经济因素与儿童健康的关联