Reddit帖子标题内容审查及分类数据集

Reddit帖子标题内容审查及分类数据集 数据来源:互联网公开数据 标签:Reddit,帖子,标题,内容审查,NSFW,SFW,文本分析,社交媒体,数据挖掘 数据概述: 本数据集包含了从Reddit平台收集的帖子数据,主要关注帖子的标题信息。数据集的核心特征包括帖子的标题文本、发布该帖子的子版块(subreddit),以及该帖子是否被标记为NSFW(Not Safe For Work,不宜在工作场合查看)的标签。

数据字段包括:

title:帖子的标题文本内容。 subreddit:帖子所属的Reddit子版块名称。 is_nsfw:帖子是否被标记为NSFW,取值为True或False。

数据用途概述: 该数据集适用于文本分类、内容审查、社交媒体分析等多种应用场景。研究人员可以利用此数据训练NSFW内容检测模型,用于自动化内容过滤;市场分析师可以分析不同子版块的标题内容特征,了解用户兴趣偏好;数据科学家可以利用此数据进行文本挖掘,探索标题文本与NSFW标签之间的关联关系。此外,该数据集也适用于自然语言处理(NLP)领域的教学和研究,例如情感分析、主题建模等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 14.86 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。