Kaggle顶级用户每日活动数据集-2020年7月20日更新-tomtillo

Kaggle顶级用户每日活动数据集-2020年7月20日更新-tomtillo 数据来源:互联网公开数据 标签:Kaggle, 用户活动, 竞赛, 脚本, 评论, 数据集, 排名, 数据分析, 行为模式 数据概述: 本数据集旨在分析Kaggle平台顶级用户的日常活动模式,包含多个子数据集,涵盖了用户在平台上的多种行为。核心数据集"USER_ACTIVITY.csv"记录了用户每日的活动情况,具体包括:

  • 提交(submissions): 用户在竞赛中提交结果的次数。
  • 评论(comments): 用户在讨论区发表评论的次数。
  • 脚本运行(script runs): 用户运行Kaggle脚本的次数。
  • 数据集更新(dataset updates): 用户创建或更新数据集的次数。

此外,还包括了基于不同维度(竞赛、讨论、脚本)的Kaggle用户排名信息,以及Kaggle ID与用户名的映射关系,具体如下:

  • "competitions_1000_ranks.csv":Kaggle竞赛排名前1000的用户及其排名。
  • "discussion_top1000_ranks.csv":Kaggle讨论区排名前1000的用户及其排名。
  • "scripts_top1000_ranks.csv":Kaggle脚本排名前1000的用户及其排名。
  • "userid_username_mapping.csv":Kaggle ID与用户名的映射关系。

数据来源于Kaggle平台的用户活动页面以及公开的metakaggle数据集。

数据用途概述: 该数据集主要用于研究Kaggle顶级用户的行为模式,例如:

  • 分析顶级用户在竞赛提交、评论、脚本运行和数据集更新等方面的活跃程度。
  • 研究顶级用户在周末提交竞赛的频率是否高于工作日。
  • 识别Kaggle平台上最活跃的顶级用户。

该数据集可以用于数据分析、数据挖掘、用户行为研究等多个领域,帮助研究人员深入了解Kaggle社区的动态,以及顶级用户成功的关键因素。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.83 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。