信贷违约预测数据集CreditDefaultPredictionDataset-yuanjun258
数据来源:互联网公开数据
标签:信贷风险, 违约预测, 贷款数据, 金融风控, 机器学习, 时间序列分析, 数据建模, 用户画像
数据概述:
该数据集包含来自信贷平台的借款人还款记录数据,记录了借款人的借款、还款情况以及是否发生违约的情况。主要特征如下:
时间跨度:数据记录了2018年全年及部分2019年的借款与还款行为。
地理范围:数据未明确标注地域信息,但根据数据集内容推断,可能来源于特定信贷平台的用户数据。
数据维度:数据集包含多个关键字段,包括:user_id(用户ID), listing_id(借款ID), auditing_date(审核日期), due_date(到期日), due_amt(应还金额), repay_date(实际还款日期), repay_amt(实际还款金额), target(目标变量,0代表未违约,1代表违约)。
数据格式:CSV格式,包含traincsv和testcsv两个文件,便于数据分析和建模。
来源信息:数据来源于公开数据集,已进行脱敏处理,以保护用户隐私。
该数据集适合用于信贷风险评估、违约预测模型构建等。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风控、信用评分、违约风险预测等领域的学术研究,如构建和评估机器学习模型预测借款人违约概率。
行业应用:为信贷行业、互联网金融平台提供数据支持,特别是在信贷审批、风险定价、贷后管理方面。
决策支持:支持金融机构的风险管理决策,优化信贷策略,降低坏账率。
教育和培训:作为金融风险管理、机器学习课程的实践案例,帮助学生和研究人员理解信贷风险评估流程。
此数据集特别适合用于探索借款人的还款行为模式与违约之间的关系,构建预测模型,提升信贷风险管理的效率和准确性。