Reddit评论情感倾向与冒犯性评分数据集

Reddit评论情感倾向与冒犯性评分数据集

数据来源:互联网公开数据

标签:Reddit,评论,情感分析,冒犯性,自然语言处理,文本数据,社交媒体,评分数据

数据概述: 本数据集包含了来自Reddit平台的英文评论,每条评论都附带一个真实数值的评分,用于量化评论的情感倾向和冒犯程度。评分范围从-1到1,其中-1表示评论最具支持性,1表示评论最具冒犯性。该数据集的构建、标注和分析过程在相关的研究论文中进行了详细阐述。

数据用途概述: 该数据集可用于情感分析、冒犯性检测、自然语言处理模型训练和评估等多种应用场景。研究人员可以使用该数据集开发和测试用于识别和分类Reddit评论情感和冒犯性的算法。此外,该数据集也适用于探索社交媒体上语言使用的模式,以及研究语言的积极和消极影响。对于希望研究在线社区行为、开发内容审核工具或进行自然语言处理研究的学者和开发者来说,这是一个非常有价值的资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.48 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。