LendingClub平台借贷行为与信用风险评估数据集

LendingClub平台借贷行为与信用风险评估数据集 数据来源:互联网公开数据 标签:借贷,贷款,信用风险,金融科技,个人信贷,违约,利率,投资,Lending Club,借款人 数据概述: 本数据集包含了Lending Club平台上的数千笔贷款信息,Lending Club是一个连接借款人和贷款人的在线平台。数据集提供了关于借款人的详细信息、贷款条款以及还款历史等关键数据。需要注意的是,该数据集仅包含实际发放的贷款,而不包括未获批准的贷款申请。

数据包含了10,000个观测值,每个观测值代表一笔贷款,共有55个变量,涵盖了借款人的个人信息、信用记录、贷款细节以及还款状态等多个维度。具体字段包括:

emp_title: 借款人的工作职位。 emp_length: 在现任职位的年限(向下取整)。超过10年则显示为10。 state: 借款人所在州的两位字母代码。 homeownership: 借款人的房屋所有权状态。 annual_income: 借款人的年收入。 verified_income: 借款人收入的验证类型。 debt_to_income: 借款人的债务收入比。 annual_income_joint: (若为联合申请)共同申请人的年收入。 verification_income_joint: (若为联合申请)共同申请人的收入验证类型。 debt_to_income_joint: (若为联合申请)共同申请人的债务收入比。 delinq_2y: 过去2年内信用额度逾期情况。 months_since_last_delinq: 距离上次逾期的时间(月)。 earliest_credit_line: 借款人最早的信用额度年份。 inquiries_last_12m: 过去12个月内对借款人的信用查询次数。 total_credit_lines: 借款人信用历史中的总信用额度数量。 open_credit_lines: 当前已开通的信用额度数量。 total_credit_limit: 总可用信用额度,不包括抵押贷款。 total_credit_utilized: 总信用余额,不包括抵押贷款。 num_collections_last_12m: 过去12个月内的催收记录数量(不包括医疗催收)。 num_historical_failed_to_pay: 借款人未付款的记录数,大致指公共记录中的不良记录数量。 months_since_90d_late: 距离上次逾期90天以上的时间(月)。 current_accounts_delinq: 当前逾期账户的数量。 total_collection_amount_ever: 借款人曾被催收的总金额。 current_installment_accounts: 分期付款账户数量,例如36个月的汽车贷款。 accounts_opened_24m: 过去24个月内新开通的信用额度数量。 months_since_last_credit_inquiry: 距离上次信用查询的时间(月)。 num_satisfactory_accounts: 满意账户的数量。 num_accounts_120d_past_due: 当前逾期120天以上的账户数量。 num_accounts_30d_past_due: 当前逾期30天以上的账户数量。 num_active_debit_accounts: 当前活跃的借记卡账户数量。 total_debit_limit: 所有借记卡限额的总和。 num_total_cc_accounts: 借款人历史上的信用卡账户总数。 num_open_cc_accounts: 当前已开通的信用卡账户总数。 num_cc_carrying_balance: 携带余额的信用卡数量。 num_mort_accounts: 抵押贷款账户的数量。 account_never_delinq_percent: 借款人从未逾期的信用额度百分比。 tax_liens: 税收留置权数量。 public_record_bankrupt: 公共记录中借款人的破产记录数量。 loan_purpose: 贷款的目的分类。 application_type: 申请类型:个人或联合。 loan_amount: 借款人获得的贷款金额。 term: 贷款期限(月)。 interest_rate: 贷款的利率。 installment: 月供。 grade: 贷款的等级。 sub_grade: 贷款的详细等级。 issue_month: 贷款发放的月份。 loan_status: 贷款的状态。 initial_listing_status: 贷款的初始上市状态。 disbursement_method: 贷款的发放方式。 balance: 贷款的当前余额。 paid_total: 借款人已偿还的总额。 paid_principal: 原始贷款额与当前余额之差。 paid_interest: 借款人已支付的利息。 paid_late_fees: 借款人支付的滞纳金。

数据用途概述: 该数据集可用于信用风险评估、贷款定价、违约预测、投资组合管理等多种应用场景。研究人员可以利用此数据分析影响贷款违约的关键因素,构建信用评分模型,并评估不同贷款产品的风险收益特征。投资者可以利用该数据进行投资决策,筛选具有较高收益潜力的贷款项目。此外,该数据集也适用于金融科技创新,例如开发个性化贷款产品或优化贷款审批流程。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.72 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。