数据集概述
这是一个关于人口贩卖案例的综合性合成数据集,涵盖受害者特征、犯罪类型、地理分布以及加害者信息等多维度数据。数据集基于CTDC(反人口贩卖数据协作组织)及其合作伙伴A21、OTSH、Polaris、LibertyShared等机构的真实案例数据合成生成,时间跨度从2002年至2021年。
数据结构
数据集包含21,195条记录,涵盖16个关键字段,主要分为受害者信息、犯罪类型、地理信息和加害者特征四个维度。数据采用CSV格式存储,文件大小约1.3MB,使用ASCII编码。
字段定义
受害者基本信息
- yearRegister(登记年份) - 人口贩卖案例被正式登记记录的年份,反映案例发现和报告的时间
- gender(性别) - 受害者的性别信息,包括男性和女性
- majorityStatus(年龄状态) - 受害者在案发时的年龄类别,区分成年人和未成年人身份
犯罪类型标识
- isForcedLabour(强制劳动标识) - 标识该案例是否涉及强制劳动类型的人口贩卖,1表示是
- isSexualExploit(性剥削标识) - 标识该案例是否涉及性剥削类型的人口贩卖,1表示是
地理分布信息
- UN_COO_Region(受害者原籍地区) - 受害者国籍所属的联合国地区划分,表示受害者来源地
- UN_COE_Region(剥削发生地区) - 人口贩卖剥削行为发生地所属的联合国地区划分
加害者基本信息
- IP_Gender(加害者性别) - 加害者的性别信息,包括男性、女性和其他类别
- IP_ageBroad(加害者年龄范围) - 加害者的大致年龄分组,采用宽泛的年龄区间划分
- IP_citizen_UNRegion(加害者国籍地区) - 加害者国籍所属的联合国地区划分
加害者与受害者关系
- IP_Relation(加害者与受害者关系) - 描述加害者与受害者之间的具体关系类型,如家庭关系、熟人关系等
- IP_PayMoney(受害者付费情况) - 标识受害者是否向加害者支付过费用,反映经济控制手段
加害者犯罪角色标识
- IP_Exploiter(剥削者角色标识) - 标识加害者是否担任直接剥削受害者的角色,1表示是
- IP_RecruiterBroker(招募经纪人角色标识) - 标识加害者是否担任招募或中介角色,1表示是
- IP_TransactionProcess(交易过程参与标识) - 标识加害者是否参与运输、转移、窝藏、走私、买卖、接收等交易过程,1表示是
- IP_ControlAbuseKidnap(控制虐待绑架角色标识) - 标识加害者是否担任控制、虐待或绑架受害者的角色,1表示是
数据特征
受害者主要为成年人,性别分布相对均衡。犯罪类型以强制劳动和性剥削为主,地理分布覆盖亚洲、欧洲、非洲等联合国主要地区划分。加害者信息显示多元化的犯罪网络结构,包含不同性别、年龄和国籍背景的参与者。
适用场景
该数据集适用于犯罪学研究、社会政策分析、国际合作研究、机器学习建模、统计分析教学等场景。可用于分析人口贩卖的地理分布模式、受害者特征、犯罪网络结构以及预防策略效果评估等研究领域。