Open_Unmix_Pytorch_SDXDB21标签噪声基线模型训练数据

数据集概述

本数据集为SDXDB21标签噪声基线相关数据,包含Open-Unmix-Pytorch模型训练的配置信息、验证集歌曲ID及训练生成的模型文件。数据集涉及音频源分离任务,针对 vocals、bass、drums、other 四类音频源分别训练模型,共包含13个文件,支持音频源分离模型的训练与评估。

文件详解

  • 模型与配置文件
  • 文件名称:separator.json、vocals.pth、drums.chkpnt、bass.pth、bass.json、other.chkpnt、bass.chkpnt、vocals.chkpnt、drums.json、other.json、vocals.json、drums.pth、other.pth
  • 文件格式:JSON、PTH、CHKPNT
  • 字段映射介绍:
  • JSON文件(如separator.json):包含音频处理参数,如nb_channels(通道数)、nfft(傅里叶变换点数)、nhop(帧移)、sample_rate(采样率)
  • PTH文件(如vocals.pth):模型权重文件,对应 vocals、bass、drums、other 四类目标音频源
  • CHKPNT文件(如drums.chkpnt):模型检查点文件,用于模型训练过程的断点续训与评估

适用场景

  • 音频源分离模型训练:基于SDXDB23标签噪声数据集训练Open-Unmix-Pytorch模型,实现 vocals、bass、drums、other 音频源的分离
  • 标签噪声基线评估:作为SDXDB21标签噪声任务的基线模型,评估标签噪声对音频源分离性能的影响
  • 音频处理参数优化:通过调整训练命令中的参数(如lr-decay-patience、source-augmentations),优化音频源分离模型的性能
  • 音乐信息检索研究:利用分离后的单音频源数据,开展音乐结构分析、乐器识别等研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 543.47 MiB
最后更新 2026年1月20日
创建于 2026年1月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。