印地语仇恨言论数据集

印地语仇恨言论数据集 数据来源:互联网公开数据 标签:印地语,仇恨言论,多标签分类,诽谤,虚假信息,仇恨,非敌对,冒犯 数据概述: 本数据集收录了使用印地语和梵文字母书写的仇恨言论记录,涵盖1963年至2021年间的数据。数据集为多标签分类类型,每条记录可包含一个或多个标签,包括诽谤、虚假信息、仇恨、非敌对、冒犯等情感类别。该数据集由Codalab平台上的相关竞赛提供,原始来源为https://competitions.codalab.org/competitions/26654learn_the_details-dataset。 数据用途概述: 该数据集适用于仇恨言论检测、多标签文本分类、情感分析等多种应用场景。研究人员和开发人员可以利用此数据集训练和评估机器学习模型,以识别和分类印地语文本中的仇恨言论。此外,数据集也适用于自然语言处理研究,帮助理解印地语中的情感表达和语言模式。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.24 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。