多模态情感识别音频与视频数据集

多模态情感识别音频与视频数据集_Multimodal_Emotion_Recognition_Audio___Video_Dataset

数据来源:互联网公开数据

标签:情感识别, 音频分析, 视频分析, 多模态, 语音情感, 面部表情, 情绪分析, 机器学习

数据概述: 该数据集包含音频文件(.wav)、视频文件(.avi)以及对应的CSV元数据,记录了不同情感状态下的语音和面部表情数据。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态情感表达样本。 地理范围:数据来源未明确标注,但可用于全球范围内的情感识别研究。 数据维度: 音频数据:提供.wav格式的音频文件,包含语音内容。 视频数据:提供.avi格式的视频文件,包含面部表情。 元数据:CSV文件,包含情感标签(Emotion)以及从音频中提取的声学特征,例如: pcm_intensity_sma_max, pcm_fftMag_mfcc_sma1_max等。 数据格式: 音频:.wav 视频:.avi 元数据:CSV格式,文件名为ANAD.csv,包含情感标签和音频特征。 该数据集适合用于多模态情感识别研究,结合音频和视频信息,以提升情感识别的准确性和鲁棒性。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于情感计算、人工智能和人机交互领域的学术研究,例如: 语音情感识别、面部表情识别、多模态情感融合。 行业应用:为智能客服、情绪分析软件、心理健康评估系统等提供数据支持,尤其在提升用户体验和情感反馈方面。 决策支持:支持在教育、娱乐、医疗等领域中构建更智能的交互系统,例如: 情感教学系统、情绪辅助治疗。 教育和培训:作为语音信号处理、计算机视觉和机器学习课程的实训材料,帮助学生理解和应用情感识别技术。 此数据集特别适合用于探索多模态情感信息的融合方法,提升情感识别的准确性,并研究不同情感表达方式的内在联系,帮助用户构建更智能和人性化的交互系统。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 558.53 MiB
最后更新 2025年11月15日
创建于 2025年11月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。