KanuriSenti_卡努里语情感词汇标注完整数据集

数据集概述

本数据集是一个专门针对卡努里语(Kanuri)构建的情感分析数据集。研究团队首先利用PanLex词库和Manga卡努里语词典编译基础词汇表,随后与约贝州立大学、迈杜古里大学及当地社区的母语者合作,验证并扩展词汇条目,收集短文本,最终构建了包含情感标注的综合性语料库。数据集进一步对高频情感词汇进行了效价、唤醒度和优势度的情感评分,形成e-ANEW格式数据。数据集包含三个Excel文件。

文件详解

  • E-Anew_Annotators.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含参与情感标注的标注者信息,可能涉及标注者背景、标注一致性等元数据。
  • E-Anew_Dataset.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含采用e-ANEW格式标注的情感词汇数据,主要字段可能包括卡努里语词汇、情感效价(Valence)、唤醒度(Arousal)、优势度(Dominance)等情感维度评分。
  • KanuriSentiUpdatedDateset.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:可能是更新后的主数据集文件,包含经过验证和扩展的卡努里语词汇、短文本语料及其情感标注信息。

适用场景

  • 低资源语言情感分析: 为卡努里语等低资源语言的情感计算研究提供标注数据支持。
  • 跨语言情感词典构建: 基于e-ANEW框架,支持卡努里语与其他语言情感词汇的对比分析和跨语言词典构建。
  • 本土语言数字资源建设: 助力卡努里语的自然语言处理资源库建设,促进该语言的数字化保存与研究。
  • 情感维度研究: 分析情感词汇在效价、唤醒度、优势度等维度上的分布特征。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.42 MiB
最后更新 2025年11月26日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。