Saraga_Audiovisual_Mini_Based_阿南达纳塔那普拉卡沙姆表演多模态数据完整样本

数据集概述

该数据集是Saraga Audiovisual数据集的子集样本,结构与原始数据集一致。包含音频、姿态估计、元数据及视频四类压缩文件,仅涵盖Adithi Prahlad表演的《Ananda Natana Prakasham》单一曲目内容。

文件详解

  • saraga audio.zip:压缩文件,包含所有多轨音频文件及其对应的混合文件
  • saraga gesture.zip:压缩文件,包含从各音频轨道对应视频中提取的姿态估计文件
  • saraga metadata.zip:压缩文件,提供所有音频文件的元数据
  • saraga video.zip:压缩文件,包含视频文件

适用场景

  • 音频处理研究:多轨音频与混合音频的对比分析
  • 姿态识别研究:音乐表演中姿态动作与音频的关联分析
  • 多媒体数据集结构分析:作为完整数据集的样本参考
  • 音乐表演多媒体整合研究:音频、视频及元数据的多模态数据应用
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 494.93 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。