LendingClub平台借贷行为与信用风险评估数据集
数据来源:互联网公开数据
标签:借贷,贷款,信用风险,金融科技,个人信贷,违约,利率,投资,Lending Club,借款人
数据概述:
本数据集包含了Lending Club平台上的数千笔贷款信息,Lending Club是一个连接借款人和贷款人的在线平台。数据集提供了关于借款人的详细信息、贷款条款以及还款历史等关键数据。需要注意的是,该数据集仅包含实际发放的贷款,而不包括未获批准的贷款申请。
数据包含了10,000个观测值,每个观测值代表一笔贷款,共有55个变量,涵盖了借款人的个人信息、信用记录、贷款细节以及还款状态等多个维度。具体字段包括:
emp_title: 借款人的工作职位。
emp_length: 在现任职位的年限(向下取整)。超过10年则显示为10。
state: 借款人所在州的两位字母代码。
homeownership: 借款人的房屋所有权状态。
annual_income: 借款人的年收入。
verified_income: 借款人收入的验证类型。
debt_to_income: 借款人的债务收入比。
annual_income_joint: (若为联合申请)共同申请人的年收入。
verification_income_joint: (若为联合申请)共同申请人的收入验证类型。
debt_to_income_joint: (若为联合申请)共同申请人的债务收入比。
delinq_2y: 过去2年内信用额度逾期情况。
months_since_last_delinq: 距离上次逾期的时间(月)。
earliest_credit_line: 借款人最早的信用额度年份。
inquiries_last_12m: 过去12个月内对借款人的信用查询次数。
total_credit_lines: 借款人信用历史中的总信用额度数量。
open_credit_lines: 当前已开通的信用额度数量。
total_credit_limit: 总可用信用额度,不包括抵押贷款。
total_credit_utilized: 总信用余额,不包括抵押贷款。
num_collections_last_12m: 过去12个月内的催收记录数量(不包括医疗催收)。
num_historical_failed_to_pay: 借款人未付款的记录数,大致指公共记录中的不良记录数量。
months_since_90d_late: 距离上次逾期90天以上的时间(月)。
current_accounts_delinq: 当前逾期账户的数量。
total_collection_amount_ever: 借款人曾被催收的总金额。
current_installment_accounts: 分期付款账户数量,例如36个月的汽车贷款。
accounts_opened_24m: 过去24个月内新开通的信用额度数量。
months_since_last_credit_inquiry: 距离上次信用查询的时间(月)。
num_satisfactory_accounts: 满意账户的数量。
num_accounts_120d_past_due: 当前逾期120天以上的账户数量。
num_accounts_30d_past_due: 当前逾期30天以上的账户数量。
num_active_debit_accounts: 当前活跃的借记卡账户数量。
total_debit_limit: 所有借记卡限额的总和。
num_total_cc_accounts: 借款人历史上的信用卡账户总数。
num_open_cc_accounts: 当前已开通的信用卡账户总数。
num_cc_carrying_balance: 携带余额的信用卡数量。
num_mort_accounts: 抵押贷款账户的数量。
account_never_delinq_percent: 借款人从未逾期的信用额度百分比。
tax_liens: 税收留置权数量。
public_record_bankrupt: 公共记录中借款人的破产记录数量。
loan_purpose: 贷款的目的分类。
application_type: 申请类型:个人或联合。
loan_amount: 借款人获得的贷款金额。
term: 贷款期限(月)。
interest_rate: 贷款的利率。
installment: 月供。
grade: 贷款的等级。
sub_grade: 贷款的详细等级。
issue_month: 贷款发放的月份。
loan_status: 贷款的状态。
initial_listing_status: 贷款的初始上市状态。
disbursement_method: 贷款的发放方式。
balance: 贷款的当前余额。
paid_total: 借款人已偿还的总额。
paid_principal: 原始贷款额与当前余额之差。
paid_interest: 借款人已支付的利息。
paid_late_fees: 借款人支付的滞纳金。
数据用途概述:
该数据集可用于信用风险评估、贷款定价、违约预测、投资组合管理等多种应用场景。研究人员可以利用此数据分析影响贷款违约的关键因素,构建信用评分模型,并评估不同贷款产品的风险收益特征。投资者可以利用该数据进行投资决策,筛选具有较高收益潜力的贷款项目。此外,该数据集也适用于金融科技创新,例如开发个性化贷款产品或优化贷款审批流程。