尼泊尔语社交媒体辱骂性言论情感分析数据集-merishnasuwal
数据来源:互联网公开数据
标签:尼泊尔语,情感分析,辱骂性言论,自然语言处理,社交媒体,文本分析,情感检测
数据概述:
本数据集基于O. M. Singh等人发表的论文“Aspect Based Abusive Sentiment Detection in Nepali Social Media Texts”构建,主要用于尼泊尔语社交媒体文本中的辱骂性言论检测和情感分析。数据集包含了从尼泊尔社交媒体平台上收集的文本数据,并进行了人工标注,标注内容包括文本是否包含辱骂性言论,以及文本的情感极性(例如正面、负面、中性)。数据集涵盖了多种主题和情感表达方式,旨在为研究人员提供一个用于训练和评估尼泊尔语情感分析模型的标准数据集。
数据用途概述:
该数据集主要用于以下几个方面:
1. 情感分析模型训练:可以用于训练基于机器学习或深度学习的尼泊尔语情感分析模型,特别是针对辱骂性言论的检测。
2. 辱骂性言论检测:用于开发和评估检测尼泊尔语社交媒体文本中辱骂性言论的算法和系统。
3. 自然语言处理研究:为尼泊尔语自然语言处理(NLP)研究提供数据支持,促进尼泊尔语文本的语义理解和情感分析技术的发展。
4. 社会学研究:可以用于研究尼泊尔社交媒体上的语言暴力和情感表达模式,为社会学研究提供数据支撑。