美国UCI成年人收入普查数据集

美国UCI成年人收入普查数据集

数据来源:互联网公开数据

标签:收入预测,人口普查,社会经济分析,分类任务,数据挖掘,机器学习,特征工程

数据概述:
本数据集来源于美国1994年的成人收入普查数据,是UCI机器学习库中的经典数据集之一。数据集包含大量人口普查相关记录,旨在帮助研究者分析和预测个人的年收入是否超过50,000美元。数据涵盖了年龄、职业、教育水平、婚姻状况、种族、性别等多维度信息,共包含14个特征和1个目标变量。数据集分为训练集和测试集,分别包含32,561条和16,281条记录,适用于分类任务和机器学习模型的开发与测试。

数据用途概述:
该数据集广泛应用于社会经济分析、收入预测建模、特征工程研究以及机器学习算法的评估和优化。研究人员可以使用该数据集研究人口普查数据中的潜在模式,探索影响个人收入水平的关键因素;数据科学从业者则可将其作为基准数据集,用于开发和验证分类模型的性能,例如逻辑回归、决策树、随机森林等。此外,该数据集还常用于教育场景,帮助学习者理解如何使用机器学习技术解决实际问题,同时进行特征选择、数据清洗和预处理的实践。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.59 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。