数据集 - 海数据

MiniLibriMix_Based_语音机器学习入门数据集完整资源

2025年12月22日 30 102 18

数据集概述该数据集是LibriMix的小型版本，用于演示目的。包含训练集（800个混合音频）和验证集（200个混合音频），以及对应的原始信号文件夹和元数据，便于数据加载。文件详解文件名称: MiniLibriMix.zip 文件格式: ZIP压缩包内部结构（根据描述）：...

ZIP

语音增强的Open_Unmix权重数据集

2025年12月20日 30 167 149

数据集概述本数据集包含基于Voicebank+Demand（二十八说话人版本）训练的Open-Unmix语音增强模型权重，采样率为一万六千赫兹。数据文件类型多样，可适配open-unmix-nnabla与open-unmix-pytorch框架使用。文件详解模型权重文件（.pth格式）： noise_04a6fc2d.pth：噪声分离模型权重文件...

ZIP

LibriCount10_0dB_说话人数量估计数据集

2025年12月16日 30 200 106

数据集概述该数据集为说话人数量估计任务提供合成数据，基于LibriSpeech CleanTest数据集构建，包含0至10个说话人同时发声的5秒音频，混合信噪比为0分贝，每个录音文件名含真实说话人数，配套JSON标注文件记录说话人性别、ID及语音活动信息。文件详解文件名称：LibriCount10-0dB.zip 文件格式：ZIP压缩包...

ZIP

PodcastMix播客音乐与语音分离数据集

2025年12月5日 30 101 100

数据集概述该数据集用于播客中的背景音乐与前景语音分离任务，包含44.1kHz音频文件及对应元数据。因Zenodo限制，此处仅提供元数据，完整数据集需从指定Google Drive链接获取，为音频分离算法研究提供支持。文件详解核心文件: podcastmix.zip: ZIP压缩格式，包含Zenodo上托管的元数据文件说明:...