贷款欺诈检测数据集
数据来源:互联网公开数据
标签:贷款申请,欺诈检测,客户信息,经济行为,风险评估,时间序列,决策支持
数据概述:
本数据集包含贷款申请相关客户信息和欺诈检测结果。数据记录了申请人的一系列特征,包括个人基本信息、经济状况、行为习惯以及申请过程中的关键行为指标。数据集旨在为贷款欺诈检测提供支持,帮助识别潜在的欺诈行为,同时为金融机构和研究人员提供数据分析的基础。
数据字段定义如下:
1. Estatura:
- 描述:客户身高,单位为米。
- 类型:数值型(浮点数)。
- 范围:通常为 1.3 至 2.2 米。
- Estado de nacimiento:
- 描述:客户出生时所在的墨西哥州。
- 类型:文本型(字符串)。
-
示例:"Nuevo León", "Veracruz", "Distrito Federal"。
-
Tiempo de aplicación en minutos:
- 描述:用户完成贷款申请表所花费的时间,单位为分钟。
- 类型:数值型(整数)。
-
范围:通常为 1 至 60 分钟。
-
Salario:
- 描述:用户每月的收入,单位为货币(例如,墨西哥比索)。
- 类型:数值型(浮点数)。
-
范围:通常为 5,000 至 100,000 比索。
-
Meses de existencia del email:
- 描述:用户电子邮件账户创建到提交贷款申请的月数。
- 类型:数值型(整数)。
-
范围:通常为 0 至 240 个月(20 年)。
-
Antigüedad de línea de teléfono en meses:
- 描述:用户电话号码激活到提交贷款申请的月数。
- 类型:数值型(整数)。
-
范围:通常为 0 至 240 个月(20 年)。
-
Signo zodiacal:
- 描述:用户的星座,根据出生日期计算得出。
- 类型:文本型(字符串)。
-
示例:"Aries", "Leo", "Pisces"。
-
Dependientes económicos:
- 描述:用户需要经济支持的家庭成员数量。
- 类型:数值型(整数)。
-
范围:通常为 0 至 10。
-
Autocalificación:
- 描述:用户对自己履行信贷义务能力的自评结果。
- 类型:文本型(字符串)。
-
示例:"Alta", "Media", "Baja"。
-
Edad:
- 描述:用户提交贷款申请时的年龄。
- 类型:数值型(整数)。
- 范围:通常为 18 至 65 岁。
-
Es fraude:
- 描述:目标变量,标记申请是否为欺诈行为。
- 类型:二进制(0 或 1)。
- 解释:0 表示正常申请,1 表示欺诈申请。
数据用途概述:
该数据集适用于以下场景:
1. 欺诈检测模型开发:通过分析用户行为和经济特征,构建机器学习或统计模型,识别潜在的欺诈性贷款申请。
2. 客户行为分析:研究客户在提交贷款申请时的行为模式,例如申请时间的长短、经济状况与欺诈风险的关系等。
3. 风险评估:帮助金融机构评估贷款申请的风险等级,优化审批流程,减少经济损失。
4. 教育与研究:可用于数据科学和机器学习课程的教学,作为案例研究或项目实践的数据集。
5. 政策制定:为制定反欺诈政策提供数据支持,帮助金融机构识别高风险申请者并采取预防措施。
通过使用该数据集,研究人员和从业者可以深入理解贷款申请中的欺诈行为模式,开发有效的欺诈检测策略,提升贷款审批的准确性和效率。
总结:本数据集提供了全面的贷款申请相关信息,包括申请人基本信息、经济状况、行为习惯以及欺诈标签,适用于贷款欺诈检测、客户行为分析、风险评估、教育研究和政策制定等多种场景。