客户流失风险预测数据集-HackerEarth挑战赛
数据来源:互联网公开数据
标签:客户流失,风险预测,机器学习,用户行为分析,用户画像,营销,HackerEarth
数据概述:
本数据集源自HackerEarth平台举办的机器学习挑战赛,旨在预测客户流失风险。数据集包含用户的人口统计学信息、浏览行为、历史购买数据等,用于评估客户在特定时间内的流失可能性。每个用户都被分配一个1到5之间的流失风险评分,该评分基于用户行为和预测的留存时间。数据集包含训练集(train.csv,36992行,25列)、测试集(test.csv,19919行,24列)和样本提交文件(sample_submission.csv,5行,2列)。
数据集中包含以下字段:
customer_id:客户的唯一标识号。
Name:客户姓名。
age:客户年龄。
security_no:用于标识客户的唯一安全号码。
region_category:客户所属的地区类别。
membership_category:客户使用的会员类别。
joining_date:客户成为会员的日期。
joined_through_referral:客户是否通过推荐码或ID加入。
referral_id:推荐ID。
preferred_offer_types:客户偏好的优惠类型。
medium_of_operation:客户进行交易的操作媒介。
internet_option:客户使用的互联网服务类型。
last_visit_time:客户上次访问网站的时间。
days_since_last_login:客户上次登录网站的天数。
avg_time_spent:客户在网站上的平均停留时间。
avg_transaction_value:客户的平均交易额。
avg_frequency_login_days:客户登录网站的平均频率。
points_in_wallet:客户在每次交易中获得的积分。
used_special_discount:客户是否使用特殊折扣。
offer_application_preference:客户是否偏好优惠。
past_complaint:客户是否提出过任何投诉。
complaint_status:客户提出的投诉是否已解决。
feedback:客户提供的反馈。
churn_risk_score:客户的流失风险评分(1-5)。
数据用途概述:
该数据集主要用于客户流失风险预测模型的构建与评估。 机器学习工程师和数据科学家可以利用此数据进行特征工程、模型训练、超参数优化,以预测客户流失风险。 此外,该数据集也适用于客户行为分析、用户画像构建、市场营销策略制定等场景。 通过对数据集的深入分析,可以帮助企业更好地理解客户需求,提高客户留存率。