芝加哥警局辖区人口统计与社会经济数据集-robertyu02
数据来源:互联网公开数据
标签:芝加哥,警局,人口统计,社会经济,辖区,犯罪,教育,收入,种族,年龄,住房,数据分析
数据概述:
本数据集旨在提供芝加哥警察局(CPD)辖区内详细的人口统计和社会经济信息,以便进行更深入的犯罪研究和警务资源分析。数据集整合了多种来源的数据,包括人口普查数据和警局辖区边界数据,通过地理空间分析方法,将人口统计数据与警局辖区对应起来。数据涵盖了年龄、种族、教育程度、收入、家庭福利等多个维度,为研究警务资源配置、犯罪模式以及社会经济因素对犯罪的影响提供了全面的数据基础。
数据用途概述:
该数据集可用于多种研究和分析场景,包括:
1. 犯罪热点分析:识别高犯罪率区域,分析其人口统计和社会经济特征。
2. 警务资源分配优化:评估警力部署与辖区人口结构、社会经济状况之间的关系,优化资源分配。
3. 教育与犯罪关系研究:探讨教育程度与犯罪率之间的关联,为预防犯罪提供依据。
4. 收入与犯罪关系研究:分析收入水平对犯罪的影响,为制定社会福利政策提供参考。
5. 种族与警务关系研究:研究不同种族群体在警务执法中的差异,促进警民关系改善。
6. 社会经济因素对犯罪的影响研究:深入分析住房、家庭福利等社会经济因素与犯罪之间的关系。
数据集包含以下关键文件:
- beatpop.txt:辖区人口和面积
- beathh.txt:家庭户数
- beatage.txt:各年龄组人口
- beatrace.txt:各族裔人口
- beathi.txt:平均家庭收入中位数
- beatfs.txt:领取食品券的人数
- beatea.txt:拥有学士学位、高中学历及无学历的人数
- beatse.txt:各年龄段在校学生人数
数据处理方法:
1. 获取了描述街区组和辖区边界的 GeoJSON 文件。
2. 创建了两个 10,000x10,000 的字符串数组,每个位置代表芝加哥的一个 13.8x13.8 英尺的区域,并将每个像素分配给其街区组/辖区。
3. 从[3]抓取了每个街区组的人口统计数据。
4. 假设同一街区组内的任何两个像素都具有相同的数据,将每个街区组的数据“分发”到其组成像素中。
5. 通过“累加”其组成像素的数据,计算每个辖区的数据。
数据准确性说明:
该数据集的准确性受到街区组和辖区边界重叠的影响。为了评估准确性,对每个辖区的数据进行了加总,并与芝加哥的总数据进行了交叉验证。结果显示,误差不超过 2%。此外,通过将估计数据绘制成地图,并与官方地图进行视觉比较,结果显示数据准确性较高。
数据来源:
[1] 芝加哥数据门户
[2] Safe Graph Inc.
[3] 统计地图集