推特线程互动模式分析数据集-2017至2018年-danielgrijalvas
数据来源:互联网公开数据
标签:推特,线程,社交媒体,互动分析,用户行为,数据收集,自然语言处理,内容研究
数据概述:
本数据集包含了2017年10月至2018年5月在推特上手动收集的约500个线程的数据。数据集分为五个部分,每个部分包含特定长度范围的线程数据(5-10条、10-15条、15-20条、20-25条、25-30条),每部分数据包含以下字段:
id:推文ID(可能需要移除以匿名化数据)
thread_number:线程标识符,用于将每个线程及其推文分组
timestamp:每条推文的创建日期
text:每条推文的内容
retweets:每条推文的转推次数
likes:每条推文的点赞次数
replies:每条推文的回复次数
数据集通过Thread Reader(网页版和机器人版)手动收集,包含的线程长度从5到30条不等。
数据用途概述:
该数据集适用于推特线程互动模式的研究、社交媒体用户行为分析以及内容传播策略的制定。研究者可以利用此数据探索线程长度与用户互动量之间的关系;营销人员可以了解如何优化推特线程以提高参与度;自然语言处理专家可以分析推文内容与用户互动之间的关联。此外,该数据集还有助于理解“标题效应”对推特线程互动的具体影响。