孟加拉语多标签情感与情绪分类数据集

数据集概述

该数据集旨在推进孟加拉语自然语言处理(NLP)研究,聚焦情感分析与情绪检测领域。包含四万零八百一十一条孟加拉语社交媒体及评论区的用户生成文本,每条文本标注情感与情绪两类标签,为相关模型训练提供标注数据支持。

文件详解

  • 文件名称: Multilabeled sentiment and emotion detection dataset.xlsx
  • 文件格式: Excel (.xlsx)
  • 核心内容: 包含四万零八百一十一条用户生成文本数据,每条数据标注两类标签:
  • 情感标签:分为极负面、负面、中性、正面、极正面五类,对应数据量占比分别为百分之二十一点九、百分之二十六点三、百分之二十一点二、百分之十七点八、百分之十二点八
  • 情绪标签:分为快乐、惊讶、性相关、宗教、平静、仇恨、恐惧七类,对应数据量占比分别为百分之十九点九、百分之八点五、百分之十七点七、百分之六、百分之十八点五、百分之十二、百分之十七点三

适用场景

  • 自然语言处理模型训练:用于训练和评估孟加拉语多标签文本分类模型
  • 情感分析研究:探究孟加拉语社交媒体文本中的情感倾向分布规律
  • 情绪识别应用:开发针对孟加拉语的情绪检测系统
  • 有害内容检测:辅助识别孟加拉语中的仇恨言论等有毒评论
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.81 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。