信贷风险预测模型测试数据集CreditRiskPredictionModelTestDataset-vaibhavsxn
数据来源:互联网公开数据
标签:信贷风险, 信用评分, 贷款违约, 机器学习, 模型评估, 风险管理, 数据分析, 预测模型
数据概述:
该数据集包含用于评估信贷风险预测模型性能的测试数据。主要特征如下:
时间跨度:数据未明确标明时间跨度,可视为用于模型验证的静态数据集。
地理范围:数据未限定地理范围,可能源于多个国家或地区,具体信息未知。
数据维度:
test_res.csv:包含模型预测结果,包括SK_ID_CURR(客户ID)、pred_cat(分类预测结果)、pred_lgb(LightGBM预测结果)、pred_xgb(XGBoost预测结果)、ridge(岭回归预测结果)、f10_dnn(深度神经网络预测结果)。
x_hold.csv:包含客户的特征数据,包括AMT_ANNUITY(年金)、AMT_CREDIT(贷款额度)、AMT_GOODS_PRICE(商品价格)、AMT_INCOME_TOTAL(总收入)、AMT_REQ_CREDIT_BUREAU_DAY等多个财务和人口统计学特征,以及各种衍生特征。
y_hold.csv:包含目标变量,即客户是否违约的真实标签。
数据格式:CSV格式,便于数据分析和模型训练。
该数据集来源于信贷风险评估领域,用于评估不同机器学习模型在预测客户违约方面的表现。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于信贷风险评估、机器学习模型性能比较等方面的学术研究。
行业应用:为金融机构提供数据支持,用于评估和优化信用评分模型,辅助风险管理决策。
决策支持:支持金融机构进行贷款审批流程优化、风险控制策略制定。
教育和培训:作为金融风险管理、机器学习课程的实训数据,帮助学生和研究人员理解信贷风险预测方法。
此数据集特别适合用于评估不同机器学习模型在信贷风险预测方面的性能,并进行模型比较和优化,以提升预测精度和风险控制能力。