精英Twitter极化数据集2010_2021

数据集概述

本数据集包含2010年1月1日至2021年12月31日期间9位全球知名公众人物的Twitter活动标注数据,涵盖原创推文和转推,包含情感评分、极化分类及主题分配等信息,覆盖政治、商业、体育等多元领域。

文件详解

该数据集以压缩包形式存储,按人物划分目录,每个目录包含两个Excel文件,具体说明如下: - 压缩包文件:Elite Twitter Polarization Dataset.zip,格式为ZIP,包含所有按人物分类的子目录及数据文件 - 人物子目录(以[Person_Name]表示): - Tweets.xlsx:Excel格式,含该人物2010-2021年原创推文数据,共10列,字段包括Creation Date(创建日期)、ID(推文ID)、Sentiment Negative Score(负面情感得分)、Sentiment Positive Score(正面情感得分)、Sentiment Compound Score(复合情感得分)、Head Topic(高层主题)、Topic(表层主题)、Stance(立场表达)、Controversy(争议性)、Is Polarized(是否极化) - Retweets.xlsx:Excel格式,含该人物同期转推数据,字段与Tweets.xlsx一致

适用场景

  • 社交媒体内容分析:研究精英用户Twitter内容的情感倾向与主题分布
  • 极化现象研究:分析不同领域公众人物推文的极化特征及影响因素
  • 自然语言处理应用:验证情感分析、主题建模算法在真实社交媒体数据中的表现
  • 跨领域比较研究:对比政治、商业、体育等领域精英用户的内容策略差异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 7.46 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。