贷款欺诈检测数据集

贷款欺诈检测数据集

数据来源:互联网公开数据

标签:贷款申请,欺诈检测,客户信息,经济行为,风险评估,时间序列,决策支持

数据概述:
本数据集包含贷款申请相关客户信息和欺诈检测结果。数据记录了申请人的一系列特征,包括个人基本信息、经济状况、行为习惯以及申请过程中的关键行为指标。数据集旨在为贷款欺诈检测提供支持,帮助识别潜在的欺诈行为,同时为金融机构和研究人员提供数据分析的基础。

数据字段定义如下:
1. Estatura:
- 描述:客户身高,单位为米。
- 类型:数值型(浮点数)。
- 范围:通常为 1.3 至 2.2 米。

  1. Estado de nacimiento:
  2. 描述:客户出生时所在的墨西哥州。
  3. 类型:文本型(字符串)。
  4. 示例:"Nuevo León", "Veracruz", "Distrito Federal"。

  5. Tiempo de aplicación en minutos:

  6. 描述:用户完成贷款申请表所花费的时间,单位为分钟。
  7. 类型:数值型(整数)。
  8. 范围:通常为 1 至 60 分钟。

  9. Salario:

  10. 描述:用户每月的收入,单位为货币(例如,墨西哥比索)。
  11. 类型:数值型(浮点数)。
  12. 范围:通常为 5,000 至 100,000 比索。

  13. Meses de existencia del email:

  14. 描述:用户电子邮件账户创建到提交贷款申请的月数。
  15. 类型:数值型(整数)。
  16. 范围:通常为 0 至 240 个月(20 年)。

  17. Antigüedad de línea de teléfono en meses:

  18. 描述:用户电话号码激活到提交贷款申请的月数。
  19. 类型:数值型(整数)。
  20. 范围:通常为 0 至 240 个月(20 年)。

  21. Signo zodiacal:

  22. 描述:用户的星座,根据出生日期计算得出。
  23. 类型:文本型(字符串)。
  24. 示例:"Aries", "Leo", "Pisces"。

  25. Dependientes económicos:

  26. 描述:用户需要经济支持的家庭成员数量。
  27. 类型:数值型(整数)。
  28. 范围:通常为 0 至 10。

  29. Autocalificación:

  30. 描述:用户对自己履行信贷义务能力的自评结果。
  31. 类型:文本型(字符串)。
  32. 示例:"Alta", "Media", "Baja"。

  33. Edad:

    • 描述:用户提交贷款申请时的年龄。
    • 类型:数值型(整数)。
    • 范围:通常为 18 至 65 岁。
  34. Es fraude:

    • 描述:目标变量,标记申请是否为欺诈行为。
    • 类型:二进制(0 或 1)。
    • 解释:0 表示正常申请,1 表示欺诈申请。

数据用途概述:
该数据集适用于以下场景:
1. 欺诈检测模型开发:通过分析用户行为和经济特征,构建机器学习或统计模型,识别潜在的欺诈性贷款申请。
2. 客户行为分析:研究客户在提交贷款申请时的行为模式,例如申请时间的长短、经济状况与欺诈风险的关系等。
3. 风险评估:帮助金融机构评估贷款申请的风险等级,优化审批流程,减少经济损失。
4. 教育与研究:可用于数据科学和机器学习课程的教学,作为案例研究或项目实践的数据集。
5. 政策制定:为制定反欺诈政策提供数据支持,帮助金融机构识别高风险申请者并采取预防措施。

通过使用该数据集,研究人员和从业者可以深入理解贷款申请中的欺诈行为模式,开发有效的欺诈检测策略,提升贷款审批的准确性和效率。

总结:本数据集提供了全面的贷款申请相关信息,包括申请人基本信息、经济状况、行为习惯以及欺诈标签,适用于贷款欺诈检测、客户行为分析、风险评估、教育研究和政策制定等多种场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.68 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。