2021年跨年夜推特内容数据集-thomaslazarus
数据来源:互联网公开数据
标签:推特,新年,跨年夜,社交媒体,情感分析,2021,新年祝福,用户情绪
数据概述:
本数据集包含了2021年12月31日晚至2022年1月1日凌晨期间,通过Twitter API抓取的约100万条提及“新年”关键词的推特内容。数据采集时间跨度约为两小时,以避免特定时区或国家的推文集中出现。抓取过程中排除了所有仅转推或引用其他用户的推文。
数据集中的列包括:
1. tweet_number: 用于记录该数据集中推文的编号,以便于管理。
2. author_id: 推文作者的唯一标识符。
3. id: Twitter提供的推文编号。
4. text: 推文的具体内容,可能包含表情符号、链接和提及。
5. username: 推文作者的用户名。
数据来源于Twitter API,是进行此类研究的基础。
数据用途概述:
该数据集适用于多种分析场景,包括新年情绪分析、社交媒体趋势研究、用户行为分析等。研究者可以通过此数据集了解公众对于新年的期望和情绪变化;媒体和品牌可以利用此数据进行市场趋势预测;教育机构可以将其用于社交媒体分析课程的教学等。此外,数据集也是进行自然语言处理和情感分析研究的重要资源。