台湾信用卡客户违约预测数据集-2005年4月至9月
数据来源:互联网公开数据
标签:信用卡,违约,风险评估,金融,台湾,客户行为,信用评分,时间序列,机器学习
数据概述:
本数据集收录了2005年4月至9月期间台湾信用卡客户的详细信息,包含客户的违约支付情况、人口统计学特征、信用数据、还款历史以及账单明细。数据为结构化表格形式,共包含25个变量,旨在用于信用风险评估和违约预测。
数据字段说明:
* ID:客户ID
* LIMIT_BAL:给予的信用额度,单位为新台币(NTD),包括个人和家庭/补充信用
* SEX:性别(1=男性,2=女性)
* EDUCATION:教育程度(1=研究生,2=大学,3=高中,4=其他,5=未知,6=未知)
* MARRIAGE:婚姻状况(1=已婚,2=单身,3=其他)
* AGE:年龄(岁)
* PAY_0至PAY_6:2005年9月至4月的还款状态,数值含义如下:-1=按时支付,1=延迟1个月支付,2=延迟2个月支付,... 8=延迟8个月支付,9=延迟9个月及以上
* BILL_AMT1至BILL_AMT6:2005年9月至4月的账单金额,单位为新台币
* PAY_AMT1至PAY_AMT6:2005年9月至4月的已支付金额,单位为新台币
* default.payment.next.month:下个月的违约支付情况(1=是,0=否)
数据用途概述:
该数据集可用于多种金融风险管理及客户行为分析场景,包括:
* 信用风险建模:构建预测信用卡客户违约概率的模型,用于风险预警和信贷决策。
* 客户细分:基于客户的信用行为和人口统计学特征,进行客户分群,制定差异化的营销策略。
* 还款行为分析:研究不同客户的还款模式,识别潜在的违约风险因素。
* 欺诈检测:辅助识别潜在的欺诈交易或异常行为。
* 机器学习训练:作为机器学习模型的训练数据,用于开发和测试信用风险评估算法。