推特情感分析数据集-2009年

推特情感分析数据集-2009年 数据来源:互联网公开数据 标签:情感分析,文本挖掘,推特,社交媒体,机器学习,自然语言处理,情绪识别

数据概述: 本数据集包含2009年推特上的推文数据,用于情感分析研究。 数据集通过自动标注方式构建,使用推文中的表情符号(如:)和:()来判断推文的情感极性,其中带有积极表情符号的推文被标记为正面,带有消极表情符号的推文被标记为负面。 数据集以CSV格式存储,移除了表情符号,包含6个字段:

0 - 推文的情感极性(0 = 负面,2 = 中性,4 = 正面) 1 - 推文的ID 2 - 推文的发布日期(例如:Sat May 16 23:58:44 UTC 2009) 3 - 查询关键词(如果无查询则为NO_QUERY) 4 - 推特用户 5 - 推文文本

数据用途概述: 该数据集主要用于情感分析相关的研究和实验,例如情感分类、情绪识别、文本情感分析模型的训练与评估等。 研究人员可以使用此数据探索不同的情感分析算法,构建和优化情感分析模型,并评估其在社交媒体数据上的表现。 此外,该数据集也适用于自然语言处理(NLP)领域的教学和实践,帮助学习者理解情感分析的基本原理和应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 55.71 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。