数据科学Reddit社区用户互动数据集-2021至2023年-th1402
数据来源:互联网公开数据
标签:Reddit,数据科学,用户互动,社区分析,社交媒体,数据挖掘,社区研究
数据概述:
本数据集包含了2021年至2023年间从数据科学Reddit社区(r/datascience)抓取的用户互动数据。利用PRAW (Reddit API)工具,收集了该社区内的帖子、评论、用户信息以及帖子的投票情况等关键数据。数据集旨在为研究Reddit社区内的用户互动模式、数据科学领域的话题热度、用户行为分析等提供数据支持。
数据包含以下字段:
- post_id:帖子的唯一标识符
- title:帖子标题
- author:帖子作者的用户名
- created_utc:帖子创建的时间戳
- score:帖子的得分(投票数)
- num_comments:帖子的评论数量
- selftext:帖子的正文内容
- comment_id:评论的唯一标识符(包括对帖子的回复及评论的回复)
- comment_author:评论作者的用户名
- comment_created_utc:评论创建的时间戳
- comment_score:评论的得分(投票数)
- comment_body:评论内容
数据来源合法且公开,通过Reddit API获取,遵循社区使用条款。
数据用途概述:
该数据集适用于社交媒体分析、用户行为研究、数据科学领域的话题分析、社区活跃度评估等多种场景。研究人员可以利用此数据集来分析数据科学领域内用户的行为特征、社区内热点话题的演变趋势以及用户互动模式等。此外,该数据集也适用于教育和培训场景,帮助学习者理解如何从社交媒体数据中提取有价值的信息。