数据集

Reddit百万笑话语料库数据集-2020年4月1日前

Reddit百万笑话语料库数据集-2020年4月1日前数据来源：互联网公开数据标签：笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学数据概述：本数据集包含了从2020年4月1日及之前，从Reddit的/r/jokes子版块收集的百万条笑话帖子。所有帖子均附带了其得分信息。数据来源于SocialGrep，为研究笑话、幽默感、文本情感提供了丰富的素材。数据用途概述：该数据集适用于多种研究和应用场景，包括但不限于：笑话生成模型训练、情感分析研究、喜剧效果评估、语言学分析、社交媒体内容分析等。研究人员可以使用此数据探索笑话的构成要素、分析不同笑话类型的受欢迎程度，以及研究幽默感与情感之间的关系。此外，该数据集也可用于开发娱乐应用，如笑话推荐系统或自动生成笑话的工具。

数据与资源

Reddit百万笑话语料库数据集-2020年4月1日前.zipZIP
92.81 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	92.81 MiB
最后更新	2025年4月16日
创建于	2025年4月16日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

Reddit百万笑话语料库数据集-2020年4月1日前

数据与资源

附加信息

注册成功！