个人借贷违约风险预测数据集PersonalLoanDefaultRiskPredictionDataset-mlproject20212
数据来源:互联网公开数据
标签:借贷, 风险评估, 违约预测, 信用评分, 机器学习, 金融风控, 数据分析, 贷款
数据概述:
该数据集包含来自金融平台的个人借贷数据,记录了借款人的信用状况、贷款信息以及最终的还款结果。主要特征如下:
时间跨度:数据未明确标注时间范围,但可推测为一段时间内的借贷行为汇总。
地理范围:数据未明确标注地理范围,但包含的特征如信用评分、贷款目的等,可推测数据来源于特定国家或地区。
数据维度:数据集包含多个维度的数据,包括贷款金额(loan_amnt)、贷款期限(term)、利率(int_rate)、分期付款额(installment)、年收入(annual_inc)、债务收入比(dti)、逾期记录(delinq_2yrs)、FICO信用评分范围(fico_range_low, fico_range_high)、查询次数(inq_last_6mths)、公开记录(pub_rec)、循环信用余额(revol_bal)、循环信用使用率(revol_util)、总账户数(total_acc)、最近一次还款额(last_pymnt_amnt)等。此外,还包括贷款是否已还清(loan_paid)的二元标签,以及其他与贷款等级、验证状态、贷款目的、申请类型和房屋所有权相关的多项虚拟变量。
数据格式:CSV格式,文件名为elite.csv,方便数据分析和建模处理。
来源信息:数据来源于公开的金融数据集,已进行匿名化处理,确保数据隐私。
该数据集适合用于信用风险评估、贷款违约预测等相关领域的数据分析和机器学习应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分建模等领域的学术研究,如违约概率预测、信用风险因素分析等。
行业应用:为金融机构提供数据支持,尤其适用于贷款审批、风险定价、信贷组合管理等。
决策支持:支持金融机构的风险管理决策,优化信贷策略,提高贷款效率。
教育和培训:作为金融风控、机器学习等课程的实训数据,帮助学生和研究人员深入理解信用风险评估方法。
此数据集特别适合用于探索借款人信用状况与贷款违约之间的关系,帮助用户构建预测模型,提升风险管理水平。