LendingClub贷款违约风险预测数据集-预处理版本V2

LendingClub贷款违约风险预测数据集-预处理版本V2 数据来源:互联网公开数据 标签:贷款,违约,风险评估,金融,信用,机器学习,Lending Club,借款人,财务 数据概述: 本数据集是Lending Club数据集的子集,经过预处理,旨在用于构建端到端的数据科学项目。原始数据集来源广泛,Kaggle上提供了用于处理原始数据集的Notebook。该数据集包含了借款人的各种财务和信用信息,以及贷款的当前状态(是否违约)。

数据字段包括:

loan_amnt:借款人申请的贷款金额。 term:贷款的还款期限,以月为单位,可以是36个月或60个月。 int_rate:贷款的利率。 sub_grade:基于借款人信用记录的贷款子等级。 emp_length:借款人的工作年限,以年为单位。 home_ownership:借款人提供的房屋所有权状态(如租房、自有、抵押等)。 annual_inc:借款人自报的年收入。 addr_state:借款人在贷款申请中提供的州。 dti:借款人总月债务支出(不包括抵押贷款)与月收入的比率。 mths_since_recent_inq:距离最近一次查询的月数。 revol_util:循环信用利用率,即借款人使用的信用额度占所有可用循环信用的比例。 bc_open_to_buy:循环银行卡的开放信用额度总额。 bc_util:所有银行卡账户的当前总余额与信用额度的比率。 num_op_rev_tl:开放循环账户的数量。 n:贷款的当前状态(例如,已完全还清或已注销),这是我们将使用模型预测的标签。

数据用途概述: 该数据集主要用于构建贷款违约风险预测模型。可以用于信用风险评估、贷款定价、投资组合管理等金融领域。数据科学家和机器学习工程师可以使用此数据集进行特征工程、模型训练和评估,以预测借款人未来是否会违约。此外,该数据集也可用于研究借款人的信用行为、分析影响贷款违约的因素,以及开发更有效的风险管理策略。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 15.47 MiB
最后更新 2025年4月17日
创建于 2025年4月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。