Reddit百万笑话语料库数据集-2020年4月1日前

Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述: 本数据集包含了从2020年4月1日及之前,从Reddit的/r/jokes子版块收集的百万条笑话帖子。所有帖子均附带了其得分信息。数据来源于SocialGrep,为研究笑话、幽默感、文本情感提供了丰富的素材。 数据用途概述: 该数据集适用于多种研究和应用场景,包括但不限于:笑话生成模型训练、情感分析研究、喜剧效果评估、语言学分析、社交媒体内容分析等。 研究人员可以使用此数据探索笑话的构成要素、分析不同笑话类型的受欢迎程度,以及研究幽默感与情感之间的关系。 此外,该数据集也可用于开发娱乐应用,如笑话推荐系统或自动生成笑话的工具。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 92.81 MiB
最后更新 2025年4月16日
创建于 2025年4月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。