Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题

Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题 数据来源:互联网公开数据 标签:Reddit, 评论, 情感分析, 毒性, 文本数据, 自然语言处理, 日本, 辩论, 萨尔瓦多, 监狱

数据概述: 本数据集包含来自Reddit论坛的评论数据,共选取了三个不同主题的帖子:探讨日本文化中的二元性、辩论讨论以及萨尔瓦多的一所监狱。数据集中的评论都经过了人工标注,标注结果分为两类:-1代表评论具有毒性,1代表评论不具有毒性。通过对评论的分析,可以研究不同话题下评论的毒性分布情况,以及探讨影响评论毒性的因素。

数据用途概述: 该数据集主要用于情感分析、毒性检测、自然语言处理模型训练等研究。研究人员可以利用该数据集训练和评估毒性检测模型,探索不同主题下评论的毒性特点。此外,该数据集也可用于社会学研究,分析不同话题下用户之间的互动模式和情感表达。例如,可以研究在辩论类帖子中,哪些语言模式更容易引发负面情绪。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.09 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。