印度犯罪数据集2018
数据来源:互联网公开数据
标签:印度犯罪,印度刑法,犯罪统计,受害者数据,犯罪率,州级数据,UT级数据,数据清洗,数据标准化,变量元数据,地理映射,权重计算
数据概述:
本数据集收录了2018年印度各邦和直辖区(Union Territory, UT)在印度刑法(IPC)各分类和子分类下的犯罪案件数量、受害者数量及平均犯罪率。数据分为三部分:原始源数据、标准化数据、变量元数据和地理映射键。原始源数据包含原始的行政维度信息;标准化数据按照LGD(Local Government Directory)地理维度进行了整理;变量元数据提供了每个变量的详细定义;地理映射键则描述了源行政单位到LGD标准地理单位的映射关系及其权重。
数据用途概述:
该数据集适用于犯罪趋势分析、受害者统计、犯罪率评估等多种场景。研究人员可以通过此数据了解印度各地区不同类型的犯罪情况;政府机构可以利用数据制定和评估相关政策;公众亦可借此数据对印度犯罪问题有更深入的了解。此外,数据集也适合用于教育培训,帮助学习者掌握犯罪数据统计与分析的方法。
举例:
- 7060_source_data.csv:包含原始源数据,包括各邦和直辖区在2018年印度刑法各分类和子分类下的犯罪案件数量、受害者数量等。
- NDAP_REPORT_7060.csv:标准化后的数据,按照LGD地理维度进行了整理,包括各邦和直辖区在2018年印度刑法各分类和子分类下的犯罪案件数量、受害者数量及平均犯罪率。
- 7060_metadata.csv:包含变量元数据,描述了每个变量的详细定义,包括变量名称、变量代码、变量类型、单位、聚合类型、加权变量名称、加权变量ID、长描述和缩放因子等。
- 7060_KEYS.csv:描述了源行政单位到LGD标准地理单位的映射关系及其权重,包括源行政单位名称、LGD标准地理单位名称、LGD标准地理单位代码、数据收集年份、子单位数量、父单位数量以及各加权变量的计数、映射错误和加权比等信息。