葡萄牙语推特仇恨言论数据集-2019-hrmello

葡萄牙语推特仇恨言论数据集-2019-hrmello 数据来源:互联网公开数据 标签:仇恨言论,葡萄牙语,推特,文本分类,自然语言处理,情感分析,机器学习,社交媒体,语言学 数据概述: 本数据集包含5,668条葡萄牙语推特文本,旨在用于仇恨言论检测和分析研究。该数据集由研究人员构建,并提供了两种不同的标注方案:第一种方案由非专业人士进行二元标注,将推文标记为“仇恨”或“非仇恨”;第二种方案由专家标注者进行更细粒度的多标签分类,总共涵盖81种仇恨言论类别。这种细粒度的分层标注方案是数据集的主要贡献,有助于识别不同类型的仇恨言论及其相互关系。

数据用途概述: 该数据集主要用于仇恨言论检测、文本分类、自然语言处理等领域的研究。研究人员可以使用该数据集训练和评估机器学习模型,以识别和分类葡萄牙语中的仇恨言论。此外,该数据集也可用于情感分析、语言学研究、社交媒体内容分析等多种应用场景。该数据集的发布旨在促进对在线仇恨言论的理解和对抗,推动相关技术的发展。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.61 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。