孟加拉语宗教仇恨评论检测平衡语料库_孟加拉国与印度

数据集概述

该数据集是针对孟加拉国和印度的孟加拉语宗教仇恨评论检测构建的平衡语料库,包含针对印度教和穆斯林群体的仇恨言论,来源于社交媒体、新闻及评论区等渠道,用于仇恨言论检测模型开发及相关社会研究。

文件详解

  • 目录:ReligiHate A Balanced Corpus for Religious Hate Co/
  • 文件1:Label.txt,格式为TXT,内容为标签说明,标注规则为Positive对应0、Negative对应1
  • 文件2:religious_hate_cleaned.xlsx,格式为Excel,包含已清洗的宗教仇恨评论数据

适用场景

  • 自然语言处理研究:用于训练和评估孟加拉语宗教仇恨言论检测的机器学习模型
  • 社会科学分析:研究孟加拉国与印度宗教仇恨言论的内容特征及社会影响因素
  • 政策制定参考:为社交媒体平台或政府机构设计反仇恨言论政策提供数据支持
  • 跨文化NLP挑战研究:探索孟加拉语语境下仇恨言论检测的文化差异及代码混合问题
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.42 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。