数据集

多模态情感识别音频与视频数据集

多模态情感识别音频与视频数据集_Multimodal_Emotion_Recognition_Audio___Video_Dataset

数据来源：互联网公开数据

标签：情感识别, 音频分析, 视频分析, 多模态, 语音情感, 面部表情, 情绪分析, 机器学习

数据概述：该数据集包含音频文件（.wav）、视频文件（.avi）以及对应的CSV元数据，记录了不同情感状态下的语音和面部表情数据。主要特征如下：时间跨度：数据未标明具体时间，可视为静态情感表达样本。地理范围：数据来源未明确标注，但可用于全球范围内的情感识别研究。数据维度：音频数据：提供.wav格式的音频文件，包含语音内容。视频数据：提供.avi格式的视频文件，包含面部表情。元数据：CSV文件，包含情感标签（Emotion）以及从音频中提取的声学特征，例如： pcm_intensity_sma_max, pcm_fftMag_mfcc_sma1_max等。数据格式：音频：.wav 视频：.avi 元数据：CSV格式，文件名为ANAD.csv，包含情感标签和音频特征。该数据集适合用于多模态情感识别研究，结合音频和视频信息，以提升情感识别的准确性和鲁棒性。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于情感计算、人工智能和人机交互领域的学术研究，例如：语音情感识别、面部表情识别、多模态情感融合。行业应用：为智能客服、情绪分析软件、心理健康评估系统等提供数据支持，尤其在提升用户体验和情感反馈方面。决策支持：支持在教育、娱乐、医疗等领域中构建更智能的交互系统，例如：情感教学系统、情绪辅助治疗。教育和培训：作为语音信号处理、计算机视觉和机器学习课程的实训材料，帮助学生理解和应用情感识别技术。此数据集特别适合用于探索多模态情感信息的融合方法，提升情感识别的准确性，并研究不同情感表达方式的内在联系，帮助用户构建更智能和人性化的交互系统。

数据与资源

多模态情感识别音频与视频数据集_Multimodal_Emotion_Recognition_...ZIP
558.53 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	558.53 MiB
最后更新	2025年11月15日
创建于	2025年11月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

多模态情感识别音频与视频数据集

数据与资源

附加信息

注册成功！