特朗普演讲字幕数据集

特朗普演讲字幕数据集 数据来源:互联网公开数据 标签:特朗普演讲,字幕,语音识别,文本分析,心理学,语言研究,自动字幕,YouTube 数据概述: 本数据集包含了从YouTube多个特朗普演讲和活动播放列表中提取的836条字幕记录。这些字幕是通过GoogleVoice等语音识别技术将特朗普的演讲内容转换而来,原始数据以CSV文件形式存储,文件名为MrTrumpSpeeches.csv。数据集中的字段包括'id', 'playlist', 'upload_date', 'title', 'view_count', 'average_rating', 'like_count', 'dislike_count', 'subtitles',字段之间以波浪线字符'~'分隔。其中,'subtitles'字段中的文本数据并不是以句子形式存在,而是一连串的单词流。 数据用途概述: 该数据集适用于语音识别技术分析、文本分析、语言学研究以及心理学研究等场景。研究人员可以通过分析这些字幕数据来研究特朗普的演讲风格、语言习惯及其背后的潜在心理特征。此外,该数据集也可以用于比较不同说话者之间的语言模式,以及评估语音识别技术的准确性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.33 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。