美国成年人收入普查数据集-1994年-shabareesharyan
数据来源:互联网公开数据
标签:收入,人口普查,社会经济,劳动力,美国,年龄,教育,职业,性别,收入预测
数据概述:
本数据集基于Ronny Kohavi和Barry Becker从美国人口普查局1994年数据库中提取的数据。数据集包含了关于美国成年人的社会经济特征和收入信息。数据共包含15个字段,涵盖了人口统计学、教育程度、职业、工作类型、收入等多个维度,旨在反映美国成年人的收入状况及其影响因素。
字段说明:
1. 年龄 (Age):个人的年龄
2. 工作类别 (Workclass):工作类型,如私企、政府部门等
3. 最终权重 (Fnlwgt):最终权重,代表人口普查中每个记录的估计权重
4. 教育程度 (Education):教育程度的文本描述
5. 受教育年限 (education_num):受教育年限的数值表示
6. 婚姻状况 (marital_status):婚姻状况,如已婚、未婚等
7. 职业 (occupation):从事的职业
8. 家庭关系 (relationship):与家庭成员的关系,如配偶、子女等
9. 种族 (race):种族
10. 性别 (sex):性别
11. 资本收益 (capital_gain):资本收益
12. 资本损失 (capital_loss):资本损失
13. 每周工作时长 (hours_per_week):每周工作的小时数
14. 原籍国 (native_country):原籍国
15. 收入 (income):年收入,通常分为两类:大于5万美元和小于等于5万美元
数据用途概述:
该数据集可用于社会经济研究、收入预测、劳动力市场分析等多种场景。研究人员可以利用此数据分析不同社会群体之间的收入差异,探索教育、职业、年龄等因素对收入的影响;企业可以利用此数据进行市场调研和目标客户分析;教育机构可将此数据用于教学案例,帮助学生理解社会经济现象。此外,该数据集也常被用于机器学习模型的训练和测试,例如收入预测模型。