多源情感数据集
数据来源:互联网公开数据
标签:情感识别,语音数据,情绪分类,音频分析,RAVDESS,CREMA-D,SAVEE
数据概述:
本数据集是由RAVDESS、CREMA-D和SAVEE三个著名的情感语音数据集合并而成,旨在为音频分类和情感识别研究提供全面的支持。RAVDESS数据集包含了从1到8种不同情绪的语音片段,如中性、平静、快乐、悲伤等,并提供了预定义的文本描述。CREMA-D数据集包含了由志愿者录制的六种情绪的语音片段,如愤怒、厌恶、恐惧、快乐、中性、悲伤,并且每个文件都有对应的文本内容。SAVEE数据集包含七种情绪的语音片段,通过文件名前缀标识情绪,并使用OpenAI的Whisper模型生成高精度的文本转录。
数据用途概述:
该数据集适用于音频分类、情感识别、情绪分析等研究领域。研究人员可以利用此数据集进行情绪识别算法的训练和测试;语音技术开发者可以借助数据集优化语音助手的情绪感知能力;心理学家可以利用该数据集研究不同情绪的语音特征及其在实际应用中的表现。此外,数据集也适合用于教育培训,帮助学习者理解情感语音数据的处理和分析方法。
举例:
本数据集中的音频片段涵盖了多种情绪,例如,RAVDESS数据集中包含一个标记为“02-01-01-01-01-01-01.wav”的文件,表示该音频片段是一位男性演员以中性情绪朗读句子“This is a box”的录音。CREMA-D数据集中包含一个标记为“1001_IWL_A.wav”的文件,表示该音频片段是一位女性演员以快乐情绪朗读句子“My name is Mike”的录音。SAVEE数据集中包含一个标记为“n01a02a.wav”的文件,表示该音频片段是一位男性演员以中性情绪朗读生成的文本的录音。这些数据片段为研究人员和开发者提供了丰富的情感语音样本,便于进行深入分析和应用开发。