吉吉瓦斯有毒评论分类数据集-2019

吉吉瓦斯有毒评论分类数据集-2019 数据来源:互联网公开数据 标签:吉吉瓦斯,有毒评论,自然语言处理,机器学习,偏见检测,评论分类,文本分析,社交媒体 数据概述: 本数据集来源于吉吉瓦斯(Jigsaw)举办的“无意偏见毒性分类”竞赛,包含大量带有标签的评论文本,旨在帮助识别和分类含有毒性内容的评论。数据集中的每个评论都标记了其是否包含毒性内容,并进一步细分为多种毒性类别,如攻击性、贬低、侮辱等。该数据集为研究者和开发者提供了丰富的资源,用于训练和评估能够识别和减轻评论中无意偏见的机器学习模型。 数据用途概述: 该数据集适用于自然语言处理、机器学习和社交媒体文本分析等多种场景。研究人员可以利用此数据集开发和改进毒性评论检测算法,从而提高在线社区的健康和包容性;开发者可以将其用于构建更加智能和公正的评论过滤系统;教育机构亦可利用本数据集进行相关课程的教学和实践。通过使用该数据集,各方可以共同努力,减少网络上的有毒言论,营造更加友善的线上交流环境。请使用本数据集时为原始来源点赞以支持该研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 717.8 MiB
最后更新 2025年6月4日
创建于 2025年6月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。