司法风险评估COMPAS数据集JudicialRiskAssessmentCOMPASDataset-mlethics
数据来源:互联网公开数据
标签:COMPAS, 风险评估, 司法, 犯罪预测, 公平性, 机器学习, 刑事司法, 数据分析
数据概述:
该数据集包含来自司法系统的数据,记录了使用COMPAS(Correctional Offender Management Profiling for Alternative Sanctions,惩教罪犯管理评估替代制裁)系统评估的被告人的信息。主要特征如下:
时间跨度:数据未明确标注具体时间范围,但通常指在COMPAS系统使用期间收集的数据。
地理范围:数据覆盖美国司法系统,具体地区未明确,但数据集常用于研究COMPAS系统在美国的应用。
数据维度:包括被告人的个人信息、犯罪记录、COMPAS评分以及两年内的再犯情况。主要字段包括:id(唯一标识符),first(名),last(姓),compas_screening_date(COMPAS评估日期),sex(性别),dob(出生日期),age(年龄),age_cat(年龄组别),race(种族),juv_fel_count(少年重罪数量),decile_score(COMPAS评分),priors_count( prior犯罪数量),c_charge_degree(指控等级),c_charge_desc(指控描述),is_recid(是否再犯),two_year_recid(两年内是否再犯)。
数据格式:CSV格式,文件名为compas-scores-two-years.csv,方便数据分析和统计。
来源信息:数据来源于公开的司法数据集,可能经过了匿名化处理。该数据集常用于研究COMPAS评分的有效性、公平性以及对不同种族群体的偏见。
该数据集适合用于犯罪风险评估、司法决策支持和机器学习模型的开发与评估。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于刑事司法、社会学、计算机科学等领域的研究,如评估COMPAS评分的预测能力、分析算法的公平性、研究种族偏见对司法判决的影响。
行业应用:可以为司法系统、刑侦机构、法律科技公司提供数据支持,用于改进风险评估流程、优化决策支持系统。
决策支持:支持司法机构在量刑、假释等方面的决策,并帮助制定更公正的司法政策。
教育和培训:作为法学、社会学、数据科学等课程的案例研究材料,帮助学生理解司法系统的工作原理和数据分析在其中的应用。
此数据集特别适合用于分析COMPAS评分与再犯率之间的关系,评估其在不同人群中的表现,并探索减少司法不公正的方法。