数据集

Reddit评论情感倾向与冒犯性评分数据集

数据来源：互联网公开数据

标签：Reddit,评论,情感分析,冒犯性,自然语言处理,文本数据,社交媒体,评分数据

数据概述：本数据集包含了来自Reddit平台的英文评论，每条评论都附带一个真实数值的评分，用于量化评论的情感倾向和冒犯程度。评分范围从-1到1，其中-1表示评论最具支持性，1表示评论最具冒犯性。该数据集的构建、标注和分析过程在相关的研究论文中进行了详细阐述。

数据用途概述：该数据集可用于情感分析、冒犯性检测、自然语言处理模型训练和评估等多种应用场景。研究人员可以使用该数据集开发和测试用于识别和分类Reddit评论情感和冒犯性的算法。此外，该数据集也适用于探索社交媒体上语言使用的模式，以及研究语言的积极和消极影响。对于希望研究在线社区行为、开发内容审核工具或进行自然语言处理研究的学者和开发者来说，这是一个非常有价值的资源。

数据与资源

Reddit评论情感倾向与冒犯性评分数据集.zipZIP
0.48 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.48 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

Reddit评论情感倾向与冒犯性评分数据集

数据与资源

附加信息

注册成功！