信贷风险评估申请人特征数据集CreditRiskAssessmentApplicantFeatureDataset-tanliheng
数据来源:互联网公开数据
标签:信贷风险, 机器学习, 贷款申请, 风险评估, 数据分析, 金融风控, 特征工程, XGBoost
数据概述:
该数据集包含申请人的信贷申请信息,记录了与信贷风险评估相关的申请人特征。主要特征如下:
时间跨度:数据未明确具体时间,但可推断为信贷申请的静态快照。
地理范围:数据来源未明确,但可泛化用于信贷风险评估研究。
数据维度:数据集包括多个字段,涵盖了申请人的财务状况、个人信息、贷款申请细节等。具体字段包括:Disbursed(是否放款)、Existing_EMI(现有EMI)、ID(申请人ID)、Loan_Amount_Applied(申请贷款额)、Loan_Tenure_Applied(申请贷款期限)、Monthly_Income(月收入)、Var4-Var5(匿名变量)、Age(年龄)、EMI_Loan_Submitted_Missing(EMI贷款提交缺失)、Interest_Rate_Missing(利率缺失)、Loan_Amount_Submitted_Missing(贷款额提交缺失)、Loan_Tenure_Submitted_Missing(贷款期限提交缺失)、Processing_Fee_Missing(手续费缺失)、Device_Type_0/1(设备类型)、Filled_Form_0/1(是否填写表格)、Gender_0/1(性别)、Var1_0-Var1_18(匿名变量)、Var2_0-Var2_6(匿名变量)、Mobile_Verified_0/1(手机验证)、Source_0-Source_2(来源)。
数据格式:CSV格式,文件名为 train_modifiedcsv,便于数据分析和模型构建。
该数据集适用于信贷风险评估、欺诈检测、信用评分等相关研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风控、信用评分模型、信贷风险评估的学术研究,例如构建预测贷款违约概率的模型。
行业应用:为金融机构提供数据支持,用于优化信贷审批流程、风险管理策略、客户画像分析等。
决策支持:支持金融机构的风险控制决策,提高贷款审批效率,降低违约风险。
教育和培训:作为金融风控、机器学习等相关课程的实训数据集,帮助学生和研究人员理解信贷风险评估流程和方法。
此数据集特别适合用于构建和评估信贷风险预测模型,探索申请人特征与贷款违约之间的关系,帮助金融机构优化风险管理策略。