社交媒体谣言与情绪分析数据集SocialMediaRumorandEmotionAnalysisDataset-bofanwang
数据来源:互联网公开数据
标签:社交媒体, 谣言检测, 情绪分析, 文本分类, 图像分析, 机器学习, Twitter, 事件检测
数据概述:
该数据集包含来自Twitter的推文数据,记录了关于特定事件的谣言传播情况,并结合了文本情绪、事件标签和图像信息。主要特征如下:
时间跨度:数据记录的时间范围集中在2015年3月20日,与日食事件相关。
地理范围:数据主要来源于Twitter平台,覆盖全球范围。
数据维度:数据集包含多个CSV文件,主要字段包括tweetId(推文ID)、tweetText(推文文本)、userId(用户ID)、imageId(s)(图像ID)、username(用户名)、timestamp(时间戳)、label(谣言标签,0代表非谣言,1代表谣言)、emotion_label(情绪标签)和event_label(事件标签)。此外,还包含图像文件(.jpg)及其描述信息。
数据格式:数据主要以CSV格式存储,便于分析和处理。图像数据为JPG格式。数据来源于Twitter平台,已进行初步的数据清洗和标注。
该数据集适合用于谣言检测、情绪分析、事件检测以及图像与文本的跨模态分析。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于社交媒体分析、谣言传播研究、自然语言处理、情感分析、多模态信息融合等领域的学术研究。
行业应用:为社交媒体监控、舆情分析、危机公关等行业提供数据支持,尤其在识别虚假信息、预测舆情趋势等方面具备实用价值。
决策支持:支持政府机构、企业等进行社会风险评估、公共事务管理和市场营销策略制定。
教育和培训:作为机器学习、自然语言处理、数据挖掘等课程的实训素材,帮助学生和研究人员深入理解社交媒体数据分析。
此数据集特别适合用于探索谣言传播的规律、情绪与谣言之间的关系,以及图像内容对谣言传播的影响,帮助用户提升对社交媒体信息的理解和分析能力。