数据集概述
本数据集为SDXDB21标签噪声基线相关数据,包含Open-Unmix-Pytorch模型训练的配置信息、验证集歌曲ID及训练生成的模型文件。数据集涉及音频源分离任务,针对 vocals、bass、drums、other 四类音频源分别训练模型,共包含13个文件,支持音频源分离模型的训练与评估。
文件详解
- 模型与配置文件
- 文件名称:separator.json、vocals.pth、drums.chkpnt、bass.pth、bass.json、other.chkpnt、bass.chkpnt、vocals.chkpnt、drums.json、other.json、vocals.json、drums.pth、other.pth
- 文件格式:JSON、PTH、CHKPNT
- 字段映射介绍:
- JSON文件(如separator.json):包含音频处理参数,如nb_channels(通道数)、nfft(傅里叶变换点数)、nhop(帧移)、sample_rate(采样率)
- PTH文件(如vocals.pth):模型权重文件,对应 vocals、bass、drums、other 四类目标音频源
- CHKPNT文件(如drums.chkpnt):模型检查点文件,用于模型训练过程的断点续训与评估
适用场景
- 音频源分离模型训练:基于SDXDB23标签噪声数据集训练Open-Unmix-Pytorch模型,实现 vocals、bass、drums、other 音频源的分离
- 标签噪声基线评估:作为SDXDB21标签噪声任务的基线模型,评估标签噪声对音频源分离性能的影响
- 音频处理参数优化:通过调整训练命令中的参数(如lr-decay-patience、source-augmentations),优化音频源分离模型的性能
- 音乐信息检索研究:利用分离后的单音频源数据,开展音乐结构分析、乐器识别等研究