信贷申请风险评估数据集CreditApplicationRiskAssessmentDataset-yogeshwari2110
数据来源:互联网公开数据
标签:信贷风控, 风险评估, 机器学习, 信用评分, 数据分析, 申请状态, 客户画像, 金融科技
数据概述:
该数据集包含来自信贷申请的数据,记录了申请人的个人信息、信贷历史、资产状况等,用于信贷风险评估。主要特征如下:
时间跨度: 数据记录的时间范围为2022年7月20日至今,具体截止时间未在数据集中体现。
地理范围: 数据覆盖范围未知,但包含印度地区常见的姓名、手机号、地址等信息。
数据维度: 数据集包括申请人的基本信息(如姓名、年龄、性别、联系方式)、信贷相关信息(如Cibil评分、Aadhar验证状态)、资产信息(如总资产成本、申请金额)、社交媒体信息(如社交媒体平台使用情况)以及申请状态等多个维度。
数据格式: CSV格式,包含Train_dataset.csv和Test_dataset.csv两个文件,Test_dataset.csv包含用于预测的UID字段。
来源信息: 数据来源于信贷申请,已进行匿名化处理,部分敏感信息可能被脱敏。该数据集适合用于信贷风险评估和申请状态预测。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于信贷风险评估、客户信用评分、欺诈检测等领域的学术研究,如基于机器学习的风险预测模型构建、客户细分研究等。
行业应用:可以为金融机构、信贷公司提供数据支持,尤其是在信贷审批流程优化、风险控制策略制定、客户画像分析等方面。
决策支持:支持金融机构的信贷决策,提高审批效率,降低坏账率。
教育和培训:作为金融风控、机器学习课程的实训材料,帮助学生和研究人员深入理解信贷风险评估流程和模型构建方法。
此数据集特别适合用于探索信贷申请人的特征与申请结果之间的关系,帮助用户构建和优化风险预测模型,提升信贷决策的准确性和效率。