客户流失风险预测数据集-HackerEarth挑战赛

客户流失风险预测数据集-HackerEarth挑战赛 数据来源:互联网公开数据 标签:客户流失,风险预测,机器学习,用户行为分析,用户画像,营销,HackerEarth 数据概述: 本数据集源自HackerEarth平台举办的机器学习挑战赛,旨在预测客户流失风险。数据集包含用户的人口统计学信息、浏览行为、历史购买数据等,用于评估客户在特定时间内的流失可能性。每个用户都被分配一个1到5之间的流失风险评分,该评分基于用户行为和预测的留存时间。数据集包含训练集(train.csv,36992行,25列)、测试集(test.csv,19919行,24列)和样本提交文件(sample_submission.csv,5行,2列)。

数据集中包含以下字段:

customer_id:客户的唯一标识号。 Name:客户姓名。 age:客户年龄。 security_no:用于标识客户的唯一安全号码。 region_category:客户所属的地区类别。 membership_category:客户使用的会员类别。 joining_date:客户成为会员的日期。 joined_through_referral:客户是否通过推荐码或ID加入。 referral_id:推荐ID。 preferred_offer_types:客户偏好的优惠类型。 medium_of_operation:客户进行交易的操作媒介。 internet_option:客户使用的互联网服务类型。 last_visit_time:客户上次访问网站的时间。 days_since_last_login:客户上次登录网站的天数。 avg_time_spent:客户在网站上的平均停留时间。 avg_transaction_value:客户的平均交易额。 avg_frequency_login_days:客户登录网站的平均频率。 points_in_wallet:客户在每次交易中获得的积分。 used_special_discount:客户是否使用特殊折扣。 offer_application_preference:客户是否偏好优惠。 past_complaint:客户是否提出过任何投诉。 complaint_status:客户提出的投诉是否已解决。 feedback:客户提供的反馈。 churn_risk_score:客户的流失风险评分(1-5)。

数据用途概述: 该数据集主要用于客户流失风险预测模型的构建与评估。 机器学习工程师和数据科学家可以利用此数据进行特征工程、模型训练、超参数优化,以预测客户流失风险。 此外,该数据集也适用于客户行为分析、用户画像构建、市场营销策略制定等场景。 通过对数据集的深入分析,可以帮助企业更好地理解客户需求,提高客户留存率。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 16:55 (UTC)
创建于 四月 14, 2025, 16:55 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。