银行营销客户存款预测数据集-2008-2010
数据来源:互联网公开数据
标签:银行营销,客户行为,预测,社会经济,时间序列,客户存款,市场营销,机器学习
数据概述:
本数据集包含了2008年5月至2010年11月期间,银行营销活动相关的客户信息及社会经济指标。数据集旨在预测客户是否会订阅银行定期存款(目标变量y),共包含21个属性,其中16个为输入变量,1个为输出变量。数据来源于银行的电话营销活动,并结合了葡萄牙国家层面的社会经济指标。数据集包括两个版本:bank-additional-full.csv(完整数据集,41188条记录)和bank-additional.csv(抽样数据集,4119条记录,用于测试计算密集型算法)。
输入变量包括:客户基本信息(年龄、职业、婚姻状况、教育程度、是否有信贷违约、是否有住房贷款、是否有个人贷款);与最近一次联系相关的属性(联系方式、联系月份、联系星期几、联系时长);其他属性(本次活动中联系次数、上次活动后经过的天数、上次活动联系次数、上次活动结果);以及社会经济背景属性(就业变动率、消费者物价指数、消费者信心指数、3个月期Euribor利率、雇员人数)。
输出变量:客户是否订阅定期存款(yes/no)。
数据用途概述:
该数据集可用于构建客户行为预测模型,评估银行营销活动的有效性,以及探索社会经济因素对客户决策的影响。具体应用包括:
1. 客户流失预测:预测客户是否会订阅定期存款,有助于银行识别潜在的客户流失风险。
2. 营销活动优化:通过分析不同营销策略对客户存款行为的影响,优化营销活动的 targeting 和策略。
3. 社会经济分析:研究宏观经济指标与客户存款行为之间的关系,为银行的风险管理和战略规划提供参考。
4. 机器学习模型训练与评估:作为机器学习模型的训练和评估数据集,用于比较不同算法的预测性能。
5. 学术研究:用于探索银行营销、客户关系管理、以及社会经济因素对金融行为的影响,为相关研究提供数据支持。