-
MiniLibriMix_Based_语音机器学习入门数据集完整资源
2025年12月22日 30 102 18
数据集概述 该数据集是LibriMix的小型版本,用于演示目的。包含训练集(800个混合音频)和验证集(200个混合音频),以及对应的原始信号文件夹和元数据,便于数据加载。 文件详解 文件名称: MiniLibriMix.zip 文件格式: ZIP压缩包 内部结构(根据描述):...
-
语音增强的Open_Unmix权重数据集
2025年12月20日 30 167 149
数据集概述 本数据集包含基于Voicebank+Demand(二十八说话人版本)训练的Open-Unmix语音增强模型权重,采样率为一万六千赫兹。数据文件类型多样,可适配open-unmix-nnabla与open-unmix-pytorch框架使用。 文件详解 模型权重文件(.pth格式): noise_04a6fc2d.pth:噪声分离模型权重文件...
-
LibriCount10_0dB_说话人数量估计数据集
2025年12月16日 30 200 106
数据集概述 该数据集为说话人数量估计任务提供合成数据,基于LibriSpeech CleanTest数据集构建,包含0至10个说话人同时发声的5秒音频,混合信噪比为0分贝,每个录音文件名含真实说话人数,配套JSON标注文件记录说话人性别、ID及语音活动信息。 文件详解 文件名称:LibriCount10-0dB.zip 文件格式:ZIP压缩包...
-
PodcastMix播客音乐与语音分离数据集
2025年12月5日 30 101 100
数据集概述 该数据集用于播客中的背景音乐与前景语音分离任务,包含44.1kHz音频文件及对应元数据。因Zenodo限制,此处仅提供元数据,完整数据集需从指定Google Drive链接获取,为音频分离算法研究提供支持。 文件详解 核心文件: podcastmix.zip: ZIP压缩格式,包含Zenodo上托管的元数据文件 说明:...
-
语音分离任务WSJ0-mix数据集说话人性别标注信息SpeechSeparationWSJ0-mixSpeakerGender-fusemuskan
2025年5月31日 30 176 52
语音分离任务WSJ0-mix数据集说话人性别标注信息SpeechSeparationWSJ0-mixSpeakerGender-fusemuskan 数据来源:互联网公开数据 标签:语音分离, 说话人识别, 性别识别, WSJ0-mix, 音频处理, 数据标注, 机器学习, 音频分析 数据概述:...



