Waze用户流失预测行为数据集-2023-anaghapaul
数据来源:互联网公开数据
标签:Waze,用户流失,数据科学,机器学习,用户行为,导航应用,用户分析,预测模型
数据概述:
本数据集是Google高级数据分析专业证书项目的一部分,模拟了Waze导航应用程序的用户行为数据。数据集包含14,999条记录,13个字段,其中包括数值型和分类型数据,旨在模拟Waze应用中的真实用户参与度和流失模式。
数据集字段包括:
- ID:每个用户的唯一标识符(int64)
- label:流失预测的目标变量(object)
- sessions:应用会话次数(int64)
- drives:记录的驾驶次数(int64)
- total_sessions:总会话次数(float64)
- n_days_after_onboarding:用户加入Waze以来的天数(int64)
- total_navigations_fav1 和 total_navigations_fav2:导航到常用地点的次数(int64)
- driven_km_drives:总驾驶距离(float64)
- duration_minutes_drives:驾驶总时长(分钟)(float64)
- activity_days:有活动的天数(int64)
- driving_days:有驾驶活动的天数(int64)
- device:使用的设备类型(object)
目标列:label,用于流失预测的目标变量。
有趣的数据特征:
- 用户参与度指标:sessions, drives, total_sessions
- 使用强度:driven_km_drives, duration_minutes_drives
- 用户忠诚度指标:n_days_after_onboarding, activity_days, driving_days
- 行为模式:total_navigations_fav1, total_navigations_fav2
数据集分布:
- 总记录数:14,999条
- 数据类型:整数型、浮点型和分类型数据混合
数据用途概述:
该数据集适用于流失预测建模、用户行为分析、数据科学项目和机器学习任务。研究人员可以利用此数据集开发预测模型,分析用户行为模式,提高用户留存率。数据科学家和机器学习工程师可将此数据集作为训练和验证数据集,以评估和优化预测算法。