Reddit政治用户多主题互动数据集2007_2022

数据集概述

本数据集包含2007-2022年Reddit政治子版块的用户互动数据,涵盖每周用户网络及消息数据库。网络中节点为用户,边为互动关系;消息库含主题、毒性、立场等属性,为研究政治话题互动提供支持。

文件详解

  • 文件名称: message_data.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含所有研究涉及的Reddit消息数据,以制表符分隔文件存储,字段包括作者用户ID、消息检测主题、消息毒性、主题立场、发送周、子版块、用户滚动意见、用户周意见
  • 文件名称: final_networks.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含2007-2022年每周用户网络数据,节点属性有用户立场(7个政治话题平均意见)、PCA主成分值、社区归属;边属性有互动权重、显著性得分、消息平均毒性、用户分歧度

适用场景

  • 政治传播研究:分析不同政治话题下用户互动模式与立场极化趋势
  • 社交媒体行为分析:探究Reddit政治社区用户网络结构及互动特征
  • 自然语言处理应用:验证BERTopic、detoxify、Llama 3等模型在政治文本中的效果
  • 计算社会科学研究:结合网络分析与文本属性,研究政治意见形成与传播机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 879.49 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。