豪萨语情感标注推文多标签情感分类数据集

数据集概述

该数据集包含一万九千七百五十七条豪萨语推文,每条标注十一种情感(愤怒、悲伤、厌恶、恐惧、惊讶、喜悦、信任、乐观、悲观、期待、中性),用于多标签情感分类任务,填补低资源语言自然语言处理领域空白,支持复杂情感检测模型训练。

文件详解

  • 文件名称: HaEmoC_V1.csv
  • 文件格式: CSV
  • 字段映射:
  • ID: 推文唯一标识符(如hausa_00001)
  • tweet: 豪萨语推文原文
  • 情感字段: anger(愤怒)、sadness(悲伤)、disgust(厌恶)、fear(恐惧)、surprise(惊讶)、joy(喜悦)、trust(信任)、optimism(乐观)、pessimism(悲观)、anticipation(期待)、neutral(中性)

适用场景

  • 低资源语言自然语言处理研究: 推进豪萨语等低资源语言的情感分类技术发展
  • 多标签情感分类模型训练: 用于训练机器学习及基于Transformer的多标签文本情感分类模型
  • 社交媒体情感分析: 研究豪萨语社交媒体用户在文化事件中的复杂情感表达
  • 情感计算应用开发: 支持多标签情感检测相关应用(如舆情分析工具)的研发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.6 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。