LendingClub平台贷款数据集-借款人信用与贷款表现数据集
数据来源:互联网公开数据
标签:贷款,信用,Lending Club,借款人,违约,风险评估,金融,贷款表现,个人理财
数据概述:
本数据集包含了通过Lending Club平台发放的数千笔贷款的相关信息,Lending Club是一个连接个人借款人和贷款人的平台。数据集记录了借款人的个人财务状况、贷款细节以及还款表现等关键信息。需要注意的是,该数据集仅包含已发放的贷款,而非所有贷款申请。
数据包含了10,000条观测数据,共55个变量,涵盖了借款人的多方面信息,例如:
emp_title:职位头衔。
emp_length:在职年限,向下取整。如果超过10年,则显示为10。
state:州代码。
homeownership:房屋所有权状态。
annual_income:年收入。
verified_income:收入验证类型。
debt_to_income:负债收入比。
annual_income_joint:如果是联合申请,则为双方的年收入。
verification_income_joint:联合收入验证类型。
debt_to_income_joint:联合申请的负债收入比。
delinq_2y:过去2年内的信用额度拖欠次数。
months_since_last_delinq:距离上次拖欠的月数。
earliest_credit_line:借款人最早的信用额度年份。
inquiries_last_12m:过去12个月内对借款人的信用查询次数。
total_credit_lines:借款人信用记录中的总信用额度数量。
open_credit_lines:当前已开通的信用额度数量。
total_credit_limit:总可用信用额度,例如,如果仅有信用卡,则为所有信用卡的额度总和。不包括抵押贷款。
total_credit_utilized:总信用余额,不包括抵押贷款。
num_collections_last_12m:过去12个月内的催收次数。不包括医疗催收。
num_historical_failed_to_pay:违规公共记录的数量,大致表示借款人未能付款的次数。
months_since_90d_late:距离上次借款人逾期90天的月数。
current_accounts_delinq:借款人当前逾期账户的数量。
total_collection_amount_ever:借款人曾被催收的总金额。
current_installment_accounts:分期付款账户的数量,大致是具有固定付款额和周期的账户。一个典型的例子可能是36个月的汽车贷款。
accounts_opened_24m:过去24个月内新开通的信用额度数量。
months_since_last_credit_inquiry:距离上次对该借款人的信用查询的月数。
num_satisfactory_accounts:令人满意的账户数量。
num_accounts_120d_past_due:当前逾期120天的账户数量。
num_accounts_30d_past_due:当前逾期30天的账户数量。
num_active_debit_accounts:当前活跃的银行卡数量。
total_debit_limit:所有银行卡限额的总和。
num_total_cc_accounts:借款人历史上的信用卡账户总数。
num_open_cc_accounts:当前已开通的信用卡账户总数。
num_cc_carrying_balance:有余额的信用卡数量。
num_mort_accounts:抵押贷款账户数量。
account_never_delinq_percent:借款人从未逾期的所有信用额度的百分比。
tax_liens:税务留置权数量。
public_record_bankrupt:该借款人在公共记录中列出的破产次数。
loan_purpose:贷款的用途类别。
application_type:申请类型:个人或联合。
loan_amount:借款人收到的贷款金额。
term:借款人收到的贷款期限,以月为单位。
interest_rate:借款人收到的贷款的利率。
installment:借款人收到的贷款的每月还款额。
grade:与贷款相关的等级。
sub_grade:与贷款相关的详细等级。
issue_month:贷款发放的月份。
loan_status:贷款的状态。
initial_listing_status:贷款的初始上市状态。(这与贷款人是否提供了整个贷款,或者贷款是否跨越多个贷款人有关。)
disbursement_method:贷款的发放方式。
balance:贷款的当前余额。
paid_total:借款人已偿还的贷款总额。
paid_principal:原始贷款金额与贷款当前余额之间的差额。
paid_interest:借款人到目前为止已支付的利息额。
paid_late_fees:借款人支付的滞纳金。
数据来源:Lending Club (https://www.lendingclub.com/info/statistics.action),该平台提供了关于通过其平台获得贷款的人的非常大的公开数据集。
数据用途概述:
该数据集可用于信用风险评估、贷款违约预测、借款人行为分析、利率定价模型构建等多种场景。研究人员可以利用此数据分析不同借款人特征与贷款表现之间的关系,建立信用评分模型;金融机构可以用于评估贷款风险,优化贷款审批流程;市场分析师可以研究贷款市场的趋势与变化。此外,该数据集也适用于教育和研究,帮助学习者了解信贷市场运作机制和风险管理。