LoanTap个人贷款信用评估数据集-2021-yekahaaagayeham
数据来源:互联网公开数据
标签:个人贷款,信用评估,LoanTap,金融科技,贷款额度,还款期限,贷款利率,信用等级,就业状况,收入验证,贷款状态,贷款用途,债务收入比,信用记录,信用利用率,银行贷款,金融分析
数据概述:
本数据集包含LoanTap平台上申请个人贷款的客户的详细信息,涵盖贷款申请金额、贷款期限、贷款利率、月还款额等关键指标,以及借款人的就业状况、年收入、信用记录等个人信息。数据集主要用于LoanTap的信用评估模型构建,以确定借款人的信用资质及合适的还款条款。数据集包含2021年期间的贷款申请记录,为金融数据分析及信用评估提供了丰富的数据源。
数据用途概述:
该数据集适用于信用评估模型构建、贷款风险管理、客户细分等场景。金融机构和研究人员可利用本数据进行信用风险分析,优化贷款审批流程;政策制定者可参考数据制定相关金融政策,提高信贷市场的健康度。
数据字段定义:
- loan_amnt:借款人申请的贷款金额
- term:贷款期限(月)
- int_rate:贷款利率
- installment:借款人每月还款金额
- grade:LoanTap评定的贷款等级
- sub_grade:LoanTap评定的贷款子等级
- emp_title:借款人提供的工作职位
- emp_length:借款人就业年限
- home_ownership:借款人提供的房产所有权状况
- annual_inc:借款人提供的年收入
- verification_status:收入验证状态
- issue_d:贷款资金发放月份
- loan_status:贷款当前状态(目标变量)
- purpose:借款人提供的贷款用途
- title:借款人提供的贷款标题
- dti:债务收入比
- earliest_cr_line:借款人最早信用记录的月份
- open_acc:借款人信用文件中的开放信用记录数量
- pub_rec:不良公共记录数量
- revol_bal:循环信用余额总额
- revol_util:循环信用利用率
- total_acc:借款人信用文件中的信用记录总数
- initial_list_status:贷款初始列表状态
- application_type:贷款申请类型
- mort_acc:抵押账户数量
- pub_rec_bankruptcies:公共记录破产数量
- address:借款人地址
问题陈述:
给定一组借款人的特征信息,判断是否应向该借款人提供贷款额度,若应提供贷款,推荐合适的还款条款。
数据样本分析:
- 按照贷款状态统计,约80%的客户已全额还款其贷款金额。
- 贷款金额与月还款额之间存在显著的正相关性,即贷款金额越大,月还款额越高。
- 大多数借款人的房产所有权状态为“已购”或“租房”。
- 信用等级为“A”的借款人确实更有可能全额还款。
- 最常见的两个工作职位为“软件工程师”和“项目经理”。
- 从银行角度出发,应重点关注模型的准确性,尤其是精确率,减少误判带来的损失。
- ROC AUC曲线和精确率-召回率曲线有助于评估模型性能,精确率和召回率之间的权衡对银行尤为重要。
- 精确率偏低可能导致银行拒绝优质借款人的贷款申请,影响放贷机会;召回率偏低则可能导致银行向违约风险较高的借款人发放贷款,增加坏账风险。
- 对模型的显著影响因素包括贷款金额、贷款期限、债务收入比、信用记录和信用利用率等。
- 地理位置对贷款结果的影响需进一步分析,但数据集中未包含具体的地理位置信息。
模型构建与评估:
- 检查数据中的重复值,处理缺失值,进行异常值处理,创建新的特征,准备好数据用于建模。
- 构建Logistic Regression模型,查看模型统计信息,显示模型系数与特征名称。
- 生成ROC AUC曲线,精确率-召回率曲线,分类报告(混淆矩阵等)进行模型评估。
- 通过调整模型参数,优化精确率和召回率之间的权衡,实现更好的风险控制和贷款审批效果。
数据集包括详细的客户信息和贷款特征,为金融分析提供精准的数据支持。通过有效的数据处理和模型构建,可为LoanTap等金融机构提供可靠的信用评估依据,优化贷款审批流程,降低贷款风险,提高客户满意度。