个人信用违约风险预测数据集PersonalCreditDefaultRiskPredictionDataset-tiphvit
数据来源:互联网公开数据
标签:信用风险, 违约预测, 信用评分, 金融风控, 机器学习, 数据分析, 客户画像, 风险评估
数据概述:
该数据集包含个人信用卡客户的信用和还款行为数据,记录了客户的基本信息、账单信息和还款记录,以及客户是否在下个月发生违约的情况。主要特征如下:
时间跨度:数据未明确标注时间范围,但可推断为一段时间内的客户行为快照。
地理范围:数据来源未明确,但包含了客户的个人信息和财务行为。
数据维度:数据集包括25个特征,涵盖客户的个人信息、历史还款记录、账单金额和还款金额,以及一个目标变量“default payment next month”,用于指示客户是否违约。具体包括:
ID:客户唯一标识符。
LIMIT_BAL:信用额度。
SEX:性别。
EDUCATION:教育程度。
MARRIAGE:婚姻状况。
AGE:年龄。
PAY_1 - PAY_6:过去6个月的还款状态。
BILL_AMT1 - BILL_AMT6:过去6个月的账单金额。
PAY_AMT1 - PAY_AMT6:过去6个月的还款金额。
default payment next month:下个月是否违约(0表示未违约,1表示违约)。
数据格式:CSV格式,文件名为credit_card_clean_2.csv,方便数据分析和建模。
来源信息:数据来源于公开数据集,已进行清洗和预处理。
该数据集适用于信用风险评估、违约预测模型构建等相关领域。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用评分模型研究等学术研究,例如探索不同特征对违约风险的影响、构建更精准的违约预测模型等。
行业应用:为银行、消费金融公司等金融机构提供数据支持,用于客户信用评估、风险控制、贷款审批等方面。
决策支持:支持金融机构的风险管理决策,优化信贷策略,降低坏账率。
教育和培训:作为金融风控、机器学习课程的实践素材,帮助学生和研究人员理解信用风险评估和预测方法。
此数据集特别适合用于构建和评估个人信用违约预测模型,帮助用户识别高风险客户,优化信贷决策,并提升风险管理水平。