巴西东北部喜剧演员YouTube_Shorts幽默转录标注数据集HuNeBR

数据集概述

本数据集包含2022年4月至2024年9月期间,巴西东北部喜剧演员在YouTube Shorts发布的475条幽默文本转录。每条记录含表演场景、原籍州、文化参考、笑点等元数据,以及8种幽默风格的多标签分类和喜剧元素解释,数据经自动化转录与人工编辑,标注流程严谨。

文件详解

  • 文件名称: brazilian_ne_annotated_humorous_texts.zip
  • 文件格式: ZIP压缩包
  • 包含内容:
  • 结构化CSV文件(17列):含幽默文本转录、元数据(表演上下文、原籍州等)、多标签幽默风格分类(趣味、善意幽默等8类)、喜剧元素解释
  • PDF文档:说明各阶段数据列的详细描述

适用场景

  • 计算语言学研究:用于巴西葡萄牙语幽默文本的NLP模型训练与分析
  • 社会文化研究:探究巴西东北部地区幽默风格的文化特征与地域差异
  • 传播学分析:研究短视频平台(YouTube Shorts)中区域喜剧内容的传播规律
  • 幽默理论应用:验证跨文化语境下幽默分类框架的适用性与扩展性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.05 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。