巴西股市情绪分析推文数据集-2011-fernandojvdasilva

巴西股市情绪分析推文数据集-2011-fernandojvdasilva 数据来源:互联网公开数据 标签:股市,情绪分析,推文,众包,巴西,金融市场,情感识别,社交媒体

数据概述: 本数据集来自于坎皮纳斯大学计算研究所的博士研究项目,由Ariadne Carvalho和Norton Roman教授指导。该项目通过众包实验对与巴西股市相关的推文进行情绪标注。数据集包含以下内容:

tweets_annotators.csv:所有标注者及其概况(不包含个人信息) tweets.csv:所有可供标注的推文列表 tweets_annotations.csv:所有单个标注结果,包含情绪、标注者、推文ID、标注日期和时间 tweets_stocks.csv:最终的标注语料库,经过多数标注者考虑后得出的结果,仅包含至少有3个标注的推文

对于每个情绪列,值0表示中性(即没有该情绪),值1表示存在该情绪。所有情绪都被标注为0的推文被视作中性。值-1表示多数标注者表示“无法回答”该情绪对(例如,无法判断推文表达的是快乐还是悲伤),值-2表示在某种情绪对中存在平局(例如,1个标注者标注为快乐,1个标注者标注为悲伤,1个标注者标注为中性)。没有其他负值。

在这些情况下,该推文不能用于使用该情绪的分类器。如果使用二元分类器进行每对情绪的分类,那么标注为负值的推文可能仍可用于其他情绪对的分类器(如果有有效值)。如果使用多类分类器,建议忽略这些推文,因为无法确定这些情绪是否存在于推文中。

tweets_stocks-full_agreement.csv:tweets_stocks.csv的一个子集,仅包含至少被3个人标注且所有标注者一致或仅一人标注为“无法回答”的推文

数据用途概述: 该数据集适用于情绪分析研究、金融市场研究、社交媒体分析和自然语言处理等领域。研究人员可以利用此数据集进行情绪识别模型的训练和验证,分析推文中的情绪对股市的影响,以及评估众包标注的质量。此外,该数据集还可以用于教育和培训,帮助学习者理解情绪标注的方法和情感分析的应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.98 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。