数据集概述
该数据集收集了2024年社交网络Reddit平台上的虚假新闻相关用户生成内容,包含3636名Reddit用户的相关数据。数据涵盖文本内容及可视化图表,支持对虚假新闻传播特征的分析,为虚假信息研究提供多维度数据基础。
文件详解
- 数据文件(共3个):
- Fake News.xlsx:Excel格式文件,存储虚假新闻相关结构化数据
- Fake News.xls:Excel格式文件,存储虚假新闻相关结构化数据
- Fake News.csv:CSV格式文件,字段包括日期、时间、帖子文本、帖子类型、标签、点赞数、评论数、奖项数、帖子语气、帖子URL、社区名称、社区成员数、作者昵称、会员年限、帖子 karma 值、评论 karma 值、获奖者 karma 值等
- 可视化图表文件(共7个PNG格式图片):
- Post tone.png:展示帖子语气分布
- Year of membership.png:展示用户会员年限分布
- Post type.png:展示帖子类型分布
- Posr type-tone.png:展示帖子类型与语气关联分布
- Post tone 2.png:展示帖子语气的补充分布
- Comments.png:展示评论相关数据分布
- 文档文件(共1个):
- опис.docx:Word格式文档,可能包含数据集相关说明
数据来源
由欧盟NextGeneration EU通过斯洛伐克恢复与韧性计划资助,项目编号09I03-03-V01-000153
适用场景
- 虚假新闻传播特征分析:研究Reddit平台上虚假新闻的发布规律与传播路径
- 社交媒体内容特征研究:分析虚假新闻相关帖子的语气、类型及用户互动行为
- 用户行为模式分析:探索虚假新闻传播者的会员年限、社区参与度等特征
- 虚假信息检测模型训练:为文本分类、虚假新闻识别等算法提供数据支持
- 社会网络分析:研究虚假新闻在Reddit社区中的传播网络结构