-
MiniLibriMix_Based_语音机器学习入门数据集完整资源
2025年12月22日 30 20 16
数据集概述 该数据集是LibriMix的小型版本,用于演示目的。包含训练集(800个混合音频)和验证集(200个混合音频),以及对应的原始信号文件夹和元数据,便于数据加载。 文件详解 文件名称: MiniLibriMix.zip 文件格式: ZIP压缩包 内部结构(根据描述):...
-
Open_Unmix_Pytorch_UMX_L音乐分离模型权重
2025年12月21日 30 122 36
数据集概述 该数据集包含Open-Unmix-Pytorch项目中UMX-L音乐分离模型的PyTorch权重文件,用于实现音乐音频的多源分离任务,支持从混合音频中提取不同乐器轨道。 文件详解 文件名称:bass-2ca1ce51.pth 文件格式:.pth 内容说明:贝斯轨道分离模型的权重文件 文件名称:drums-69e0ebd4.pth...
-
Saraga_Audiovisual_Mini_Based_阿南达纳塔那普拉卡沙姆表演多模态数据完整样本
2025年12月15日 30 181 162
数据集概述 该数据集是Saraga Audiovisual数据集的子集样本,结构与原始数据集一致。包含音频、姿态估计、元数据及视频四类压缩文件,仅涵盖Adithi Prahlad表演的《Ananda Natana Prakasham》单一曲目内容。 文件详解 saraga audio.zip:压缩文件,包含所有多轨音频文件及其对应的混合文件...
-
CitySpeechMix语音与城市声音混合模拟数据集
2025年12月7日 30 52 17
数据集概述 本数据集是模拟音频数据集,将LibriSpeech的语音片段与SONYC-UST的环境录音混合,生成语音与背景噪声的受控混合数据。包含三百七十一条混合音频和三百七十一条无语音城市环境录音,每条音频时长十秒,附语音转录和环境声音类别标签。 文件详解 压缩文件: cityspeechmix.zip: 包含数据集核心内容,分为两个子文件夹...



