美运信用卡违约风险预测数据集
数据来源:互联网公开数据
标签:信用卡违约,风险预测,机器学习,客户信息,数据分析,金融预测,美国运通
数据概述:
本数据集来源于美国运通与HackerEarth联合举办的“AmExpert 2021 CODELAB – 机器学习黑客马拉松”竞赛。数据集包含1963年至2021年间印度的初创企业完整记录,旨在帮助参赛者建立机器学习模型以预测信用卡违约风险。数据集分为训练集(train.csv)和测试集(test.csv),分别包含45528和11383条记录,及一个样本提交文件(sample_submission.csv)。数据集列出了客户的唯一识别信息、基本信息、收入、职业、信用情况、贷款历史等关键要素。
数据用途概述:
该数据集适用于信用卡违约风险预测、信用分析、金融风险评估等多种场景。研究人员可利用此数据进行信用风险预测模型的开发与验证;金融机构可借助数据进行客户信用评估;政策制定者可基于数据评估信贷政策的有效性。此外,数据集也适合用于教育培训,帮助学习者理解信用风险管理的基本原理。
数据字段定义:
customer_id:客户唯一标识符
name:客户姓名
age:客户年龄(年)
gender:客户性别(F表示女性,M表示男性)
owns_car:客户是否拥有汽车(Y表示是,N表示否)
owns_house:客户是否拥有房产(Y表示是,N表示否)
no_of_children:客户子女数量
net_yearly_income:客户净年收入(美元)
no_of_days_employed:客户工作天数
occupation_type:客户职业类型(IT员工,经理,会计师,厨师等)
total_family_members:客户家庭成员数量
migrant_worker:客户是否为农民工(1表示是,0表示否)
yearly_debt_payments:客户年债务偿还额(美元)
credit_limit:客户信用额度(美元)
credit_limit_used(%):客户信用额度使用百分比
credit_score:客户信用评分
prev_defaults:客户之前违约次数
default_in_last_6months:客户过去6个月是否违约(1表示是,0表示否)
credit_card_default:客户是否将违约(1表示是,0表示否)