Reddit冠状病毒讨论数据集-2021-gpreda

Reddit冠状病毒讨论数据集-2021-gpreda 数据来源:互联网公开数据 标签:冠状病毒,Reddit,社交媒体,讨论,公共卫生,疫情分析,公众意见

数据概述: 本数据集包含了来自Reddit论坛中Coronavirus子版块的帖子和评论数据。Coronavirus子版块是一个拥有超过240万订阅者的讨论区,用户在此交流与冠状病毒相关的各种话题。数据集中的内容通过使用Python Reddit API Wrapper (praw)从https://www.reddit.com/r/Coronavirus/收集而来。

数据集包含帖子和评论两类信息,每条记录均包括以下字段: - title: 帖子标题(仅限帖子) - score: 帖子得分(仅限帖子),基于帖子的影响和评论数量 - id: 帖子或评论的唯一标识符 - url: 帖子链接(仅限帖子) - commns_num: 帖子下的评论数量(仅限帖子) - created: 创建日期 - body: 帖子或评论的文本内容 - timestamp: 时间戳

数据用途概述: 该数据集适用于公共卫生研究、社会媒体分析、公众情绪监测以及疫情信息传播研究等多种场景。研究人员可以利用此数据了解公众对冠状病毒的看法和反应;政策制定者可以依据数据制定相应的应对措施;教育机构可以利用此数据进行社会媒体分析的教学。数据集为冠状病毒相关研究提供了丰富的文本数据资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.49 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。