信贷风险评估数据集CreditRiskAssessmentDataset-shubhamchauhan22222

信贷风险评估数据集CreditRiskAssessmentDataset-shubhamchauhan22222

数据来源:互联网公开数据

标签:信贷风险, 信用评分, 贷款违约, 机器学习, 数据分析, 金融风控, 客户画像, 预测模型

数据概述: 该数据集包含个人信贷申请人的相关信息,用于评估其信用风险,预测其未来贷款违约的可能性。主要特征如下: 时间跨度:数据未明确标明时间,可视为某一时段的信贷申请人快照。 地理范围:数据未限定具体地理位置,但根据字段信息推测,可能来源于特定国家或地区。 数据维度:数据集包含大量特征,涵盖了申请人的个人信息、财务状况、过往信用记录等,具体包括:SK_ID_CURR(申请人ID)、NAME_CONTRACT_TYPE(贷款类型)、CODE_GENDER(性别)、FLAG_OWN_CAR(是否有车)、AMT_INCOME_TOTAL(收入总额)、AMT_CREDIT(贷款额度)、AMT_ANNUITY(年金)、AMT_GOODS_PRICE(商品价格)、NAME_TYPE_SUITE(与申请人同住的人员类型)、NAME_INCOME_TYPE(收入类型)、NAME_EDUCATION_TYPE(教育程度)、NAME_FAMILY_STATUS(家庭状况)、NAME_HOUSING_TYPE(居住类型)、REGION_POPULATION_RELATIVE(区域人口密度)、DAYS_BIRTH(出生日期与申请日期的天数差)、DAYS_EMPLOYED(雇佣天数)、DAYS_REGISTRATION(注册天数)、DAYS_ID_PUBLISH(身份证发布天数)、OWN_CAR_AGE(车龄)、FLAG_WORK_PHONE(是否有工作电话)、OCCUPATION_TYPE(职业类型)、REGION_RATING_CLIENT(区域评分)、REGION_RATING_CLIENT_W_CITY(包含城市在内的区域评分)、WEEKDAY_APPR_PROCESS_START(申请开始的星期几)、LIVE_REGION_NOT_WORK_REGION(居住地与工作地是否为同一区域)、REG_CITY_NOT_LIVE_CITY(注册城市与居住城市是否相同)、LIVE_CITY_NOT_WORK_CITY(居住城市与工作城市是否相同)、ORGANIZATION_TYPE(组织类型)、EXT_SOURCE_1/2/3(外部数据源1/2/3)、APARTMENTS_AVG/MODE/MEDI(公寓平均/模式/中位数)、ENTRANCES_AVG/MODE/MEDI(入口平均/模式/中位数)、FLOORSMAX_AVG/MODE/MEDI(最高楼层平均/模式/中位数)、LIVINGAREA_AVG(居住面积平均)、TOTALAREA_MODE(总面积模式)、WALLSMATERIAL_MODE(墙体材料模式)、DEF_30_CNT_SOCIAL_CIRCLE(逾期30天还款次数)、DEF_60_CNT_SOCIAL_CIRCLE(逾期60天还款次数)、DAYS_LAST_PHONE_CHANGE(上次电话号码变更的天数)、FLAG_DOCUMENT_3/8/18(是否提供文件3/8/18)、AMT_REQ_CREDIT_BUREAU_HOUR/WEEK/QRT(向信用局查询的次数(小时/周/季度))、DOCUMENT_COUNT(文件数量)、NEW_DOC_KURT、AGE_RANGE(年龄范围)、EXT_SOURCES_PROD(外部数据源乘积)、EXT_SOURCES_WEIGHTED(外部数据源加权)、EXT_SOURCES_MIN/MAX/MEAN/NANMEDIAN/VAR(外部数据源的最小值/最大值/均值/中位数/方差)、CREDIT_TO_ANNUITY_RATIO(信用额度与年金比率)、CREDIT_TO_GOODS_RATIO(信用额度与商品价格比率)、ANNUITY_TO_INCOME_RATIO(年金与收入比率)、CREDIT_TO_INCOME_RATIO(信用额度与收入比率)、INCOME_TO_EMPLOYED_RATIO(收入与雇佣天数比率)、INCOME_TO_BIRTH_RATIO(收入与出生日期比率)、EMPLOYED_TO_BIRTH_RATIO(雇佣天数与出生日期比率)、ID_TO_BIRTH_RATIO(ID与出生日期比率)、CAR_TO_BIRTH_RATIO(汽车与出生日期比率)、CAR_TO_EMPLOYED_RATIO(汽车与雇佣天数比率)、PHONE_TO_BIRTH_RATIO(电话与出生日期比率)、GROUP_EXT_SOURCES_MEDIAN/STD(外部数据源中位数/标准差)、GROUP_INCOME_MEAN/STD(收入均值/标准差)、GROUP_CREDIT_TO_ANNUITY_MEAN/STD(信用额度与年金比率均值/标准差)、GROUP_CREDIT_MEAN/ANNUITY_MEAN/ANNUITY_STD(信用额度均值/年金均值/年金标准差)、BUREAU_SK_ID_BUREAU_NUNIQUE(信用局唯一ID数量)、BUREAU_DAYS_CREDIT_MIN/MAX/MEAN(信用局最早/最晚/平均信用天数)、BUREAU_DAYS_CREDIT_ENDDATE_MIN/MAX(信用局最早/最晚结束日期)、BUREAU_AMT_CREDIT_MAX_OVERDUE_MAX/MEAN(信用局最大逾期额度最大值/均值)、BUREAU_AMT_CREDIT_SUM_MAX/MEAN/SUM/DEBT_MAX/DEBT_MEAN/DEBT_SUM/OVERDUE_MAX/OVERDUE_MEAN/OVERDUE_SUM(信用局信用额度总和的最大值/均值/总和/债务最大值/均值/总和/逾期额度最大值/均值/总和)、BUREAU_AMT_ANNUITY_MEAN(信用局年金均值)、BUREAU_DEBT_CREDIT_DIFF_MEAN/SUM(信用局债务与信用额度差值的均值/总和)、BUREAU_MONTHS_BALANCE_MEAN_MEAN/VAR(信用局月度余额的均值/方差)、BUREAU_MONTHS_BALANCE_SIZE_MEAN/SUM(信用局月度余额大小的均值/总和)、BUREAU_STATUS_0_MEAN/1_MEAN/12345_MEAN/C_MEAN/X_MEAN(信用局状态为0/1/12345/C/X的均值)、BUREAU_CREDIT_ACTIVE_Active_MEAN/Closed_MEAN/Sold_MEAN(信用局信用活跃状态的均值)、BUREAU_CREDIT_TYPE_Consumercredit_MEAN(信用局消费信贷均值)等。 数据格式:CSV格式,文件名为test_data_preprocessed.csv,适合进行数据分析和建模。 该数据集经过预处理,包含了原始数据经过特征工程后的衍生变量,方便直接用于建模。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于金融风控、信用风险评估等领域的学术研究,如信用评分模型、违约预测模型等。 行业应用:为银行、消费金融公司等金融机构提供数据支持,用于客户信用评估、贷款审批、风险管理等。 决策支持:支持金融机构的风险控制决策,优化信贷策略,降低坏账率。 教育和培训:作为金融风险管理、信用评估、机器学习等课程的实训数据集,帮助学生和研究人员深入理解信贷风险评估。 此数据集特别适合用于构建和评估信用风险预测模型,帮助用户识别高风险客户,优化信贷决策,提高贷款组合的盈利能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 29, 2025, 02:39 (UTC)
创建于 五月 29, 2025, 02:39 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。