美国成人收入预测数据集USAdultIncomePredictionDataset-gredoy

美国成人收入预测数据集USAdultIncomePredictionDataset-gredoy

数据来源:互联网公开数据

标签:收入预测, 人口统计, 机器学习, 劳动力市场, 统计分析, 数据挖掘, 收入分类, 普查数据

数据概述: 该数据集包含来自美国人口普查的数据,记录了关于个人收入的预测信息。主要特征如下: 时间跨度:数据未标明具体时间,视作静态数据快照。 地理范围:数据主要覆盖美国地区。 数据维度:数据集包括多个维度,如年龄 (age)、工作类别 (workclass)、教育程度 (education, educational-num)、婚姻状况 (marital-status)、职业 (occupation)、与家庭的关系 (relationship)、种族 (race)、性别 (gender)、资本收益 (capital-gain)、资本损失 (capital-loss)、每周工作时长 (hours-per-week) 和原籍国 (native-country) 等,以及一个唯一的标识符 (id)。 数据格式:数据集以 CSV 格式提供,包含 traincsv、testcsv 和 sample_submissioncsv 三个文件,便于数据分析和模型训练。 来源信息:数据来源于公开的普查数据,已进行标准化处理。 该数据集适合用于人口统计学、社会经济学等领域的研究,以及收入预测、分类等机器学习模型的构建。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于社会经济学、劳动力市场分析等领域的研究,例如收入影响因素分析、社会群体收入差异研究等。 行业应用:可以为人力资源管理、市场调研、金融分析等行业提供数据支持,尤其是在评估个人信用、预测消费能力等方面。 决策支持:支持政府部门在制定社会保障政策、优化就业服务等方面的决策。 教育和培训:作为数据科学、机器学习课程的实践材料,帮助学生掌握数据预处理、特征工程和模型构建等技能。 此数据集特别适合用于探索影响个人收入的多种因素,构建收入预测模型,并进行相关的社会经济分析。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 1, 2025, 10:14 (UTC)
创建于 五月 1, 2025, 10:14 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。