数据集

贷款欺诈检测数据集

数据来源：互联网公开数据

标签：贷款申请,欺诈检测,客户信息,经济行为,风险评估,时间序列,决策支持

数据概述：
本数据集包含贷款申请相关客户信息和欺诈检测结果。数据记录了申请人的一系列特征，包括个人基本信息、经济状况、行为习惯以及申请过程中的关键行为指标。数据集旨在为贷款欺诈检测提供支持，帮助识别潜在的欺诈行为，同时为金融机构和研究人员提供数据分析的基础。

数据字段定义如下：
1. Estatura:
- 描述：客户身高，单位为米。
- 类型：数值型（浮点数）。
- 范围：通常为 1.3 至 2.2 米。

Estado de nacimiento:
描述：客户出生时所在的墨西哥州。
类型：文本型（字符串）。
示例："Nuevo León", "Veracruz", "Distrito Federal"。
Tiempo de aplicación en minutos:
描述：用户完成贷款申请表所花费的时间，单位为分钟。
类型：数值型（整数）。
范围：通常为 1 至 60 分钟。
Salario:
描述：用户每月的收入，单位为货币（例如，墨西哥比索）。
类型：数值型（浮点数）。
范围：通常为 5,000 至 100,000 比索。
Meses de existencia del email:
描述：用户电子邮件账户创建到提交贷款申请的月数。
类型：数值型（整数）。
范围：通常为 0 至 240 个月（20 年）。
Antigüedad de línea de teléfono en meses:
描述：用户电话号码激活到提交贷款申请的月数。
类型：数值型（整数）。
范围：通常为 0 至 240 个月（20 年）。
Signo zodiacal:
描述：用户的星座，根据出生日期计算得出。
类型：文本型（字符串）。
示例："Aries", "Leo", "Pisces"。
Dependientes económicos:
描述：用户需要经济支持的家庭成员数量。
类型：数值型（整数）。
范围：通常为 0 至 10。
Autocalificación:
描述：用户对自己履行信贷义务能力的自评结果。
类型：文本型（字符串）。
示例："Alta", "Media", "Baja"。
Edad:
- 描述：用户提交贷款申请时的年龄。
- 类型：数值型（整数）。
- 范围：通常为 18 至 65 岁。
Es fraude:
- 描述：目标变量，标记申请是否为欺诈行为。
- 类型：二进制（0 或 1）。
- 解释：0 表示正常申请，1 表示欺诈申请。

数据用途概述：
该数据集适用于以下场景：
1. 欺诈检测模型开发：通过分析用户行为和经济特征，构建机器学习或统计模型，识别潜在的欺诈性贷款申请。
2. 客户行为分析：研究客户在提交贷款申请时的行为模式，例如申请时间的长短、经济状况与欺诈风险的关系等。
3. 风险评估：帮助金融机构评估贷款申请的风险等级，优化审批流程，减少经济损失。
4. 教育与研究：可用于数据科学和机器学习课程的教学，作为案例研究或项目实践的数据集。
5. 政策制定：为制定反欺诈政策提供数据支持，帮助金融机构识别高风险申请者并采取预防措施。

通过使用该数据集，研究人员和从业者可以深入理解贷款申请中的欺诈行为模式，开发有效的欺诈检测策略，提升贷款审批的准确性和效率。

总结：本数据集提供了全面的贷款申请相关信息，包括申请人基本信息、经济状况、行为习惯以及欺诈标签，适用于贷款欺诈检测、客户行为分析、风险评估、教育研究和政策制定等多种场景。

数据与资源

贷款欺诈检测数据集.zipZIP
0.68 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.68 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

贷款欺诈检测数据集

数据与资源

附加信息

注册成功！