乌克兰-俄罗斯战争Reddit用户观点情感分析数据集-diyacharya
数据来源:互联网公开数据
标签:乌克兰,俄罗斯,战争,Reddit,情感分析,公众观点,社交媒体,冲突,政治,舆情
数据概述:
本数据集包含从Reddit平台抓取的关于乌克兰-俄罗斯战争的帖子,旨在进行情感分析,以了解公众对这场冲突的观点。数据抓取基于“乌克兰”、“俄罗斯”、“北约”等关键词,覆盖了多个子版块(subreddits),以获取丰富的内容。数据采集使用Python的PRAW库(Reddit API wrapper),具体数据提取方式可参考提供的Colab Notebook。
数据经过清洗和预处理,移除了标点符号、标签、URL、特殊符号;处理了表情符号和颜文字;进行了分词、词形还原、停用词移除等操作。
数据用途概述:
该数据集主要用于情感分析,以预测评论的总体情感倾向(积极、消极、中性)。此外,该数据还可用于更细粒度的分析,例如将评论分类为亲俄罗斯、中立或亲乌克兰立场。研究人员可以利用此数据进行舆情分析,了解战争对公众情绪的影响,分析不同群体观点的差异,并追踪公众情绪随时间的变化。该数据集也适用于教育和科研,例如作为自然语言处理、情感分析、文本挖掘等课程的案例,或用于研究社交媒体在冲突中的作用。