数据集概述
本数据集包含Twitter平台上5个新建虚假新闻传播过程的实证研究结果,涵盖虚假新闻及其对应的真相传播内容。数据集分为传播数据集(DD)和图数据集(DG)两类,记录了虚假新闻相关推文、转发的用户信息、传播路径及用户网络关系,共15个文件。
文件详解
- 传播数据集(DD)
- 文件名称:遵循
FNx_DD.xlsx模式(x为虚假新闻编号1-5)
- 文件格式:XLSX
- 字段映射介绍:每行对应一条推文/转发,包含用户ID、用户发布数量、语言、粉丝数、关注数、发布时间、点赞数、转发数、嵌套内容标识、发布设备来源、推文ID、转发ID、引用ID、回复ID、出现频率、内容状态(r=虚假新闻/a=真相/q=疑问/n=无关)
- 图数据集(DG)
- 图文件:遵循
FNx_DG.graph模式(x为虚假新闻编号1-5)
- 文件格式:.graph
- 字段映射介绍:记录用户间的链接关系,节点标签为图中进入顺序编号
- 标签文件:遵循
FNx_Labels.jsonl模式(x为虚假新闻编号1-5)
- 文件格式:JSONL
- 字段映射介绍:每行对应图文件中的节点,记录真实用户ID;节点标签n对应JSONL文件第n+2行
数据来源
论文“A study on real graphs of fake news spreading on Twitter”
适用场景
- 虚假新闻传播路径分析:研究Twitter平台虚假新闻及真相的传播扩散规律
- 社交媒体用户行为研究:分析虚假新闻传播中用户的发布、转发及互动行为特征
- 网络拓扑结构分析:通过用户关系图探究虚假新闻传播的网络结构特性
- 虚假信息识别研究:基于推文内容状态标签,训练和验证虚假新闻识别模型
- 传播影响因素研究:分析用户粉丝数、发布时间等因素对虚假新闻传播的影响