GoogleMerchandiseStore购物车添加预测数据集

GoogleMerchandiseStore购物车添加预测数据集 数据来源:互联网公开数据
标签:电子商务,用户行为分析,购物车预测,会话分析,设备属性,地理位置,流量来源,机器学习

数据概述
本数据集来自Google Merchandise Store,是一个真实的电子商务场景。数据通过匿名化处理的Google Analytics数据生成,记录了每个访客会话的详细信息。目标是预测访客在某个会话中是否会将商品添加到购物车。数据集包含19个特征,涵盖访客ID、会话时间、设备类型、地理位置、流量来源等维度,以及关键的目标变量“addedToCart”,用于标识访客是否在会话中添加了商品到购物车。

数据用途概述
该数据集适用于以下场景:
1. 电子商务分析:研究用户在购物过程中的行为模式,特别是从浏览到购物车添加的转化路径,帮助企业优化电商流程。
2. 机器学习建模:可用于构建预测模型,预测用户是否会将商品添加到购物车,从而支持精准营销和个性化推荐。
3. 用户行为分析:分析不同设备、操作系统、流量来源对用户行为的影响,了解关键的用户特征和行为驱动因素。
4. 市场策略优化:通过分析历史数据,识别高转化率的用户属性和行为特征,指导营销策略和产品推广。
5. 用户体验优化:识别用户在购物过程中可能的流失点,优化网站或移动应用的用户体验,提高转化率。

数据字段说明
以下是数据集中的关键字段及其定义:

  1. fullVisitorId
  2. 描述:唯一标识每个访客的ID,用于跟踪访客的会话历史。
  3. 类型:字符串(String)

  4. visitStartTime

  5. 描述:会话开始的时间戳,以POSIX时间(秒数)表示。
  6. 类型:数值(Numeric)

  7. date

  8. 描述:会话发生的日期。
  9. 类型:日期(Date)

  10. deviceCategory

  11. 描述:用户使用的设备类型,分类为“Mobile”(移动设备)、“Tablet”(平板电脑)或“Desktop”(桌面设备)。
  12. 类型:字符串(String)

  13. isMobile

  14. 描述:布尔值,表示用户是否使用移动设备访问(true表示是,false表示否)。
  15. 类型:布尔(Boolean)

  16. operatingSystem

  17. 描述:设备的操作系统,例如“Macintosh”或“Windows”。
  18. 类型:字符串(String)

  19. browser

  20. 描述:用户使用的浏览器,例如“Chrome”或“Firefox”。
  21. 类型:字符串(String)

  22. country

  23. 描述:根据IP地址推断的用户所在国家。
  24. 类型:字符串(String)

  25. city

  26. 描述:根据IP地址或地理ID推断的用户所在城市。
  27. 类型:字符串(String)

  28. trafficSource

    • 描述:流量来源,可能是搜索引擎名称、引用的主机名或URL参数中的utm_source值。
    • 类型:字符串(String)
  29. trafficMedium

    • 描述:流量来源的媒介类型,例如“organic”(自然搜索)、“cpc”(付费点击)、“referral”(引用)或URL参数中的utm_medium值。
    • 类型:字符串(String)
  30. trafficCampaign

    • 描述:营销活动的值,通常由URL参数中的utm_campaign设置。
    • 类型:字符串(String)
  31. isFirstVisit

    • 描述:布尔值,表示该会话是否为访客的首次访问(1表示是,0表示否)。
    • 类型:数值(Numeric)
  32. isBounce

    • 描述:布尔值,表示用户是否在会话中仅访问了一个页面后离开(1表示是,0表示否)。
    • 类型:数值(Numeric)
  33. totalVisits

    • 描述:该访客在所有会话中的总访问次数。
    • 类型:数值(Numeric)
  34. totalHits

    • 描述:该访客在所有会话中的总交互次数(如点击、滚动等)。
    • 类型:数值(Numeric)
  35. totalPageviews

    • 描述:该访客在所有会话中的总页面浏览次数。
    • 类型:数值(Numeric)
  36. totalTimeOnSite

    • 描述:该访客在所有会话中总停留时间。
    • 类型:数值(Numeric)
  37. totalTransactions

    • 描述:该访客在所有会话中的总交易次数。
    • 类型:数值(Numeric)
  38. productPagesViewed

    • 描述:该会话中浏览的产品页面数量。
    • 类型:数值(Numeric)
  39. addedToCart

    • 描述:目标变量,表示该会话中用户是否将商品添加到购物车(1表示添加,0表示未添加)。
    • 类型:数值(Numeric)

数据价值
该数据集提供了丰富的会话级和用户级信息,支持多维度的分析和建模。通过挖掘这些数据,可以帮助企业和研究人员:
- 理解用户行为模式,优化电商网站或移动应用的用户体验。
- 预测用户是否会将商品添加到购物车,从而制定精准的营销策略。
- 分析不同流量来源、设备类型和地理位置对用户行为的影响,优化流量获取和用户转化。
- 评估现有营销活动的成效,指导未来活动的设计和投放。

此数据集特别适合从事电子商务、用户行为分析、机器学习建模等相关领域的研究人员和从业者使用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 19.55 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。