信贷风险评估预测数据集CreditRiskAssessmentPredictionDataset-zhou9198
数据来源:互联网公开数据
标签:信贷风险, 风险评估, 机器学习, 信用评分, 贷款违约, 数据分析, 金融风控, 风险预测
数据概述:
该数据集包含来自金融机构的信贷申请人相关信息,记录了申请人的个人特征、信用历史以及贷款表现。主要特征如下:
时间跨度:数据记录的时间范围集中在2019年。
地理范围:数据未明确标注地理范围,但从数据字段推测,可能来源于特定地区或国家。
数据维度:数据集包括申请人的身份信息、教育程度、工作信息、贷款额度、历史还款记录、以及其他相关的信用指标。关键字段包括:id(用户唯一标识),certId(身份证号),loanProduct(贷款产品类型),gender(性别),age(年龄),dist(地区),edu(教育程度),job(职业),lmt(贷款额度),以及一系列衍生特征x_0至x_78,certValidBegin(身份证有效期起始时间),certValidStop(身份证有效期截止时间),bankCard(银行卡信息),ethnic(民族),residentAddr(居住地址),highestEdu(最高学历),linkRela(关联关系),setupHour(申请时间),weekday(申请星期),ncloseCreditCard(已关闭信用卡数量),unpayIndvLoan(未偿还个人贷款),unpayOtherLoan(未偿还其他贷款),unpayNormalLoan(未偿还正常贷款),5yearBadloan(五年内不良贷款记录),isNew(是否新客户),target(贷款是否违约,0代表未违约,1代表违约)。
数据格式:CSV格式,包含train_target_2019.csv(训练集,包含目标变量)和test_2019.csv(测试集,不含目标变量)两个文件,便于数据分析和建模。
来源信息:数据来源于金融机构,已进行匿名化处理,用于信贷风险评估模型开发。
该数据集适合用于信贷风险预测、违约概率评估、信用评分建模等。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、信用风险量化、机器学习在金融领域的应用等方面的学术研究,如违约预测模型的构建、特征重要性分析等。
行业应用:可以为银行、消费金融公司、互联网金融平台等提供数据支持,特别是在信贷审批、风险定价、贷后管理等方面。
决策支持:支持金融机构进行风险评估、优化贷款策略、提高风险管理水平。
教育和培训:作为金融风险管理、信用评分建模等课程的实训数据,帮助学生和研究人员深入理解信贷风险评估。
此数据集特别适合用于探索信贷申请人的特征与贷款违约之间的关系,帮助用户构建和优化信贷风险预测模型,实现更精准的风险控制和决策。