乌兹别克语二元情感分类标注句子数据集

数据集概述

该数据集是首个开放的乌兹别克语短句子二元情感分类标注语料库,包含四千六百七十六个句子,其中三千零四十二个为积极情感,一千六百三十四个为消极情感。文本采用现代乌兹别克语拉丁字母书写,以日常短句为主,平均长度约六个词。

文件详解

  • 数据集文件:
  • UZ_positive.txt: TXT格式文件,每行包含一个积极情感的乌兹别克语句子
  • UZ_negative.txt: TXT格式文件,每行包含一个消极情感的乌兹别克语句子
  • Dataset.xlsx: Excel格式文件,整合了积极和消极情感的句子及短语数据

适用场景

  • 自然语言处理研究: 用于乌兹别克语情感分类模型的训练与评估
  • 低资源语言处理: 推动乌兹别克语自然语言处理技术的发展
  • 情感分析应用: 为乌兹别克语场景下的情感倾向分析提供数据支持
  • 语言学研究: 分析乌兹别克语日常用语中的情感表达特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.31 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。