数据科学Reddit社区用户互动数据集-2021至2023年-th1402

数据科学Reddit社区用户互动数据集-2021至2023年-th1402 数据来源:互联网公开数据 标签:Reddit,数据科学,用户互动,社区分析,社交媒体,数据挖掘,社区研究

数据概述: 本数据集包含了2021年至2023年间从数据科学Reddit社区(r/datascience)抓取的用户互动数据。利用PRAW (Reddit API)工具,收集了该社区内的帖子、评论、用户信息以及帖子的投票情况等关键数据。数据集旨在为研究Reddit社区内的用户互动模式、数据科学领域的话题热度、用户行为分析等提供数据支持。

数据包含以下字段: - post_id:帖子的唯一标识符 - title:帖子标题 - author:帖子作者的用户名 - created_utc:帖子创建的时间戳 - score:帖子的得分(投票数) - num_comments:帖子的评论数量 - selftext:帖子的正文内容 - comment_id:评论的唯一标识符(包括对帖子的回复及评论的回复) - comment_author:评论作者的用户名 - comment_created_utc:评论创建的时间戳 - comment_score:评论的得分(投票数) - comment_body:评论内容

数据来源合法且公开,通过Reddit API获取,遵循社区使用条款。

数据用途概述: 该数据集适用于社交媒体分析、用户行为研究、数据科学领域的话题分析、社区活跃度评估等多种场景。研究人员可以利用此数据集来分析数据科学领域内用户的行为特征、社区内热点话题的演变趋势以及用户互动模式等。此外,该数据集也适用于教育和培训场景,帮助学习者理解如何从社交媒体数据中提取有价值的信息。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.07 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。