世界银行健康分类数据集2021

数据集概述

本数据集基于世界银行数据库2023年5月获取的2021年全球健康指标数据,筛选缺失值少于75%的指标并以地区均值填补剩余缺失值,将国家划分为低收入(46国)和高收入(140国)两类,用于分类任务研究。

文件详解

  • 文件名称: WB health data for classification/wb_y.csv
  • 文件格式: CSV
  • 字段映射: 包含国家分类标签(Y字段,1代表高收入,0代表低收入)
  • 文件名称: WB health data for classification/wb_x_health.csv
  • 文件格式: CSV
  • 字段映射: 包含多项健康相关指标,如SH.DYN.MORT(孕产妇死亡率)、SP.POP.TOTL(总人口)、SH.IMM.HEPB(乙肝疫苗接种率)等

数据来源

World Bank DataBank

适用场景

  • 机器学习分类模型训练: 基于健康指标预测国家收入类别
  • 全球健康与经济关联分析: 探究健康指标与国家收入水平的相关性
  • 公共卫生政策研究: 比较不同收入组别国家的健康指标差异
  • 数据预处理方法验证: 测试缺失值填补策略在分类任务中的效果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.1 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。