豪萨语多标签情感分类语料库

数据集概述

该数据集包含一万二千七百六十一条豪萨语推特文本,每条标注愤怒、悲伤等十一种情感标签,适用于多标签文本分类任务。数据聚焦文化事件,由母语者人工标注,仅开放文本与标注内容,助力低资源语言情感分类研究。

文件详解

  • 文件名称:HaEmoC_MLTC.csv
  • 文件格式:CSV
  • 字段映射:
  • ID:数据唯一标识符
  • Original Tweet:豪萨语原始推特文本
  • English Translation:英文翻译文本
  • anger、sadness、disgust、fear、surprise、joy、trust、optimism、pessimism、anticipation、neutral:十一种情感标签(多标签标注)

数据来源

Twitter API(通过合规方式收集并处理)

适用场景

  • 低资源语言自然语言处理研究:豪萨语情感分类模型训练与评估
  • 多标签文本分类技术开发:提升社交媒体文本情感分析模型鲁棒性
  • 跨语言情感计算:探索低资源语言情感表达模式与标注方法
  • 社会舆情分析:豪萨语社交媒体平台情感倾向挖掘
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.74 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。