数据集概述
本数据集为2023年亚特兰大大学联盟与摩根士丹利数据竞赛的成果,包含美国33704个邮政编码的人口统计与商业指标。数据集由获奖团队“Blue Barbies”制作,涵盖地理位置、人口、经济及商业等多维度信息,共包含2个文件。
文件详解
- data_sources.xlsx
- 文件格式:XLSX
- 字段映射介绍:说明数据集各列的来源信息,用于追溯各指标的原始数据出处
- zip_code_demographics.csv
- 文件格式:CSV
- 字段映射介绍:包含邮政编码(zip)、经纬度(lat,lng)、城市(city)、州信息(state_id,state_name)、人口数据(population,density)、县名(county_name)、基础设施距离(dist_highway等)、商业数量(number_of_business)、收入指标(adjusted_gross_income等)等核心字段
数据来源
亚特兰大大学联盟与摩根士丹利2023年数据竞赛获奖项目,详细创建过程可参考GitHub仓库:https://github.com/erkara/auc-data-challenge-23
适用场景
- 区域经济分析:基于邮政编码维度的收入水平与商业分布研究
- 人口地理研究:分析美国各地区人口密度与地理特征的关联
- 商业选址参考:利用商业数量、收入水平等指标评估潜在商业区域
- 数据竞赛案例研究:作为数据竞赛成果数据集,用于竞赛方法与成果分析
- 多源数据整合实践:通过data_sources文件学习多维度指标的数据源整合方法