黑人平权运动社交媒体情感分析数据集-BlackLivesMatter-2020年4月至7月
数据来源:互联网公开数据
标签:情感分析,社交媒体,推特,黑人平权运动,情绪识别,文本数据,社会运动
数据概述:
本数据集旨在用于黑人平权运动(BlackLivesMatter)的情感分析研究。数据来源于多个公开渠道,主要用于分析公众对该社会运动的情感倾向。数据集包含推特文本数据,并结合预先标注的情感标签,以便进行情感分析模型的训练和评估。
情感标签:
情感标签基于Robert Pluthick的情感之轮(包括愤怒、悲伤、厌恶、惊讶、信任、喜悦、恐惧和期待),并对原始数据的情感进行了重新映射。每个情感类别的数据实例数量约为8000个,但“惊讶”、“期待”和“厌恶”这三个情感类别的数据实例数量可能略有差异。
数据文件:
training-dataset.csv:该文件详细描述了数据集的创建过程,请参考相关文章以获取更详细信息。
live-minnesota.csv:包含2020年4月1日至7月31日期间,从明尼苏达州收集的推特数据,推文包含BlackLivesMatters标签。
live-washington.csv:包含2020年4月1日至7月31日期间,从华盛顿特区收集的推特数据,推文包含BlackLivesMatters标签。
数据用途概述:
该数据集主要用于情感分析研究,特别是针对社会运动和公众舆论的情感分析。研究人员可以使用该数据集训练和评估情感分析模型,探索公众对黑人平权运动的情感反应,并分析不同地区、不同时间段的情感差异。此外,该数据集也适用于文本挖掘、自然语言处理等相关研究,以及社会学、政治学等领域的学术研究。