哥伦比亚家庭收入预测项目数据集2018

数据集概述

本数据集围绕2018年哥伦比亚家庭收入预测项目构建,基于哥伦比亚综合住户调查(GEIH)数据,采用明瑟方程模型,包含数据处理文件、分析代码、可视化图表及结构化数据,为收入预测研究提供支持。

文件详解

  • 数据文件:
  • clean_data.csv:CSV格式,包含处理后的家庭收入相关数据,字段包括性别(sex)、年龄(age)、教育水平(maxEducLevel)、总收入(y_total_m_ha)等
  • base_filtrada.csv:CSV格式,包含筛选后的基础数据集,字段与clean_data.csv一致
  • 代码文件:
  • Analysis.R:R格式,用于数据分析的代码文件
  • clean_data.R:R格式,用于数据清洗的代码文件
  • win_runall.ps1:PS1格式,Windows系统下的批处理运行脚本
  • 可视化文件:
  • ingreso_edad.png:PNG格式,收入与年龄关系的可视化图表
  • salario_por_hora.png:PNG格式,小时工资相关的可视化图表
  • bigote.png:PNG格式,箱线图可视化图表
  • disp_ing_edad.png:PNG格式,收入与年龄的散点图
  • distribucion_edad.png:PNG格式,年龄分布的可视化图表
  • 文档文件:
  • README.txt:TXT格式,项目说明文档,介绍项目背景、数据来源及模型设计

数据来源

哥伦比亚综合住户调查(GEIH)

适用场景

  • 劳动经济学研究:分析教育、年龄等因素对收入的影响
  • 收入预测模型构建:基于明瑟方程开发家庭收入预测模型
  • 数据可视化分析:探索哥伦比亚家庭收入分布特征
  • 社会经济政策评估:为收入相关政策制定提供数据支持
  • 数据科学教学案例:用于数据清洗、分析及可视化的实践教学
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.79 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。