孟加拉语社交媒体图像情感与辱骂分析数据集BanglaSocialMediaImageSentimentandAbuseAnalysis-rakibulhasanrajib
数据来源:互联网公开数据
标签:图像分析, 情感分析, 辱骂检测, 社交媒体, 孟加拉语, 多模态, 文本标注, 机器学习
数据概述:
该数据集包含来自孟加拉语社交媒体平台的图像数据,并附带相应的标注信息,用于情感分析与辱骂检测。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态数据集。
地理范围:数据主要来源于孟加拉语社交媒体环境。
数据维度:数据集包括图像文件(.jpg)和对应的标注文件(BanglaAbuseMeme_annotation.csv)。标注文件包含以下字段:
Ids:图像文件名。
sentiment:情感标签(例如:Negative, Neutral)。
sarcasm:是否包含反讽。
vulgar:是否包含粗俗内容。
abuse:是否包含辱骂内容。
target:辱骂指向的目标(例如:Political, Individual, Others)。
数据格式:数据以CSV格式提供标注信息,图像为JPG格式。数据已进行初步的标注和整理,便于后续分析。
该数据集适合用于情感分析、辱骂检测、多模态学习等研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于社交媒体内容分析、情感分析、辱骂检测等领域的学术研究,如结合图像和文本信息进行情感识别、恶意内容检测等。
行业应用:可以为社交媒体平台、内容审核机构提供数据支持,用于自动化内容 moderation,提升用户体验,维护社区环境。
决策支持:支持社交媒体平台的风险管理和内容策略制定,辅助平台识别和处理有害内容。
教育和培训:作为图像处理、自然语言处理、机器学习等课程的辅助材料,帮助学生和研究人员深入理解情感分析和辱骂检测技术。
此数据集特别适合用于探索孟加拉语社交媒体环境下的情感表达和辱骂行为模式,帮助用户构建图像识别、情感分析模型,提升内容审核的效率和准确性。