Reddit平台政治新闻文章算法前后对比数据集-2022年3月至5月-anjalikapoor14
数据来源:互联网公开数据
标签:Reddit,社交媒体,算法,假新闻,政治,新闻文章,传播,数据分析,舆情分析
数据概述:
本数据集是针对Reddit平台在2022年4月12日引入推荐算法前后,r/politics版块中新闻文章的数据集合。数据集旨在研究社交媒体算法对假新闻传播的影响。数据来源于2005年至2023年Reddit平台公开数据,其中选取了r/politics版块在算法实施前一个月(2022年3月12日至2022年4月11日)和算法实施后一个月(2022年4月12日至2022年5月11日)的帖子。每个时间段内,选取了点赞数最高的100个帖子。由于r/politics版块的帖子通常包含新闻文章链接,因此数据集包含了这些新闻文章的标题和正文内容,这些内容是手动收集的。由于部分网站存在付费墙,导致算法实施前的数据集中有96个数据点,算法实施后的数据集中有88个数据点。
数据用途概述:
该数据集适用于分析社交媒体算法对新闻文章传播的影响,特别是对假新闻传播的影响。研究人员可以利用此数据比较算法前后新闻文章的标题内容、来源、话题等,进而评估算法对信息传播的潜在影响。此外,该数据集也适用于进行情感分析、文本挖掘等研究,探索不同算法下用户对新闻内容的反应差异。该数据集为研究社交媒体算法与信息传播之间的关系提供了宝贵的数据资源,可用于学术研究、政策制定以及公众教育等领域。