YouTube游戏和应用中虚拟形象视频转录文本数据集

YouTube游戏和应用中虚拟形象视频转录文本数据集 数据来源:互联网公开数据 标签:YouTube,视频转录,虚拟形象,游戏,应用,自然语言处理,文本分析,情感分析 数据概述: 本数据集包含从YouTube视频中提取的音频转录文本。视频地址通过youtube-data-api-v3收集,音频转录文本同样获取自YouTube。每个视频被分割成250个单词的文本块,平均对应1.5分钟的对话时间。每个文本块由LLaMA 3 70B Instruct模型进行标记评估。 数据用途概述: 该数据集适用于自然语言处理、文本分析、情感分析等多种研究场景。研究人员可以利用此数据进行情感分析,了解用户对游戏和应用中虚拟形象的看法;可以进行文本摘要、主题建模等研究,以提取视频内容的关键信息;此外,该数据集也适用于机器翻译、语音识别等领域。

数据集描述: 评估文本块的情感,使用情绪PAD模型。 提供每个维度的系数,范围从-10到10: 愉悦度(Pleasure):-10(最大不愉悦)到10(最大愉悦) 唤醒度(Arousal):-10(最大不唤醒)到10(最大唤醒) 支配度(Dominance):-10(最大服从)到10(最大支配) 文本:{文本块}

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 214.42 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。