Kaggle顶级用户每日活动数据集-2020年7月20日更新-tomtillo
数据来源:互联网公开数据
标签:Kaggle, 用户活动, 竞赛, 脚本, 评论, 数据集, 排名, 数据分析, 行为模式
数据概述:
本数据集旨在分析Kaggle平台顶级用户的日常活动模式,包含多个子数据集,涵盖了用户在平台上的多种行为。核心数据集"USER_ACTIVITY.csv"记录了用户每日的活动情况,具体包括:
- 提交(submissions): 用户在竞赛中提交结果的次数。
- 评论(comments): 用户在讨论区发表评论的次数。
- 脚本运行(script runs): 用户运行Kaggle脚本的次数。
- 数据集更新(dataset updates): 用户创建或更新数据集的次数。
此外,还包括了基于不同维度(竞赛、讨论、脚本)的Kaggle用户排名信息,以及Kaggle ID与用户名的映射关系,具体如下:
- "competitions_1000_ranks.csv":Kaggle竞赛排名前1000的用户及其排名。
- "discussion_top1000_ranks.csv":Kaggle讨论区排名前1000的用户及其排名。
- "scripts_top1000_ranks.csv":Kaggle脚本排名前1000的用户及其排名。
- "userid_username_mapping.csv":Kaggle ID与用户名的映射关系。
数据来源于Kaggle平台的用户活动页面以及公开的metakaggle数据集。
数据用途概述:
该数据集主要用于研究Kaggle顶级用户的行为模式,例如:
- 分析顶级用户在竞赛提交、评论、脚本运行和数据集更新等方面的活跃程度。
- 研究顶级用户在周末提交竞赛的频率是否高于工作日。
- 识别Kaggle平台上最活跃的顶级用户。
该数据集可以用于数据分析、数据挖掘、用户行为研究等多个领域,帮助研究人员深入了解Kaggle社区的动态,以及顶级用户成功的关键因素。