个人信用违约预测训练数据集PersonalCreditDefaultPredictionTrainingDataset-mgbpeace
数据来源:互联网公开数据
标签:信用风险, 违约预测, 机器学习, 金融风控, 数据挖掘, 信用评分, 风险评估, 客户画像
数据概述:
该数据集包含来自Kaggle平台的数据,记录了个人信用违约相关的财务和人口统计信息,用于构建和评估信用风险预测模型。主要特征如下:
时间跨度:数据未明确标注时间范围,通常被视为静态数据集使用。
地理范围:数据未明确标注地理范围,可用于构建通用的信用风险预测模型。
数据维度:数据集包含12个字段,包括“SeriousDlqin2yrs”(两年内发生 90 天以上逾期未还款的比例,即违约指标)、“RevolvingUtilizationOfUnsecuredLines”(循环信用额度使用率)、“age”(年龄)、“NumberOfTime30-59DaysPastDueNotWorse”(过去两年内 30-59 天逾期次数)、“DebtRatio”(负债率)、“MonthlyIncome”(月收入)、“NumberOfOpenCreditLinesAndLoans”(开放信贷数量)、“NumberOfTimes90DaysLate”(过去两年内 90 天以上逾期次数)、“NumberRealEstateLoansOrLines”(不动产贷款数量)、“NumberOfTime60-89DaysPastDueNotWorse”(过去两年内 60-89 天逾期次数)、“NumberOfDependents”(家属人数)。
数据格式:CSV格式,文件名为cs-training.csv,方便数据分析和建模。
来源信息:数据来源于Kaggle平台,已进行数据清洗和预处理,可以直接用于建模。该数据集适合用于信用风险评估和违约预测模型的开发。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分建模等领域的研究,探索不同特征对信用违约的影响。
行业应用:为银行、消费金融公司等金融机构提供数据支持,用于客户信用评估、风险定价、信贷决策等。
决策支持:支持金融机构的风险管理策略制定,如优化信贷审批流程、调整风险容忍度等。
教育和培训:作为金融风控、数据挖掘、机器学习等课程的实训案例,帮助学生和研究人员理解信用风险建模。
此数据集特别适合用于构建和评估信用风险预测模型,从而帮助用户提升风险管理能力、优化信贷决策,并实现对潜在违约风险的预警。