-
SPECS_Based_语音风格关键词采集与背景噪声数据集
2026年1月29日 30 152 147
数据集概述 本数据集包含命令风格语音关键词(ck)、扩展命令风格语音关键词(eck)、对话风格语音(cs)三个子集及背景噪声文件夹,用于关键词识别和语音风格分析研究。所有语音为用户在安静环境下录制的16kHz 32位PCM WAV文件,背景噪声源自Google语音命令集。 文件详解 主文件 文件名称:SPECS.zip 文件格式:ZIP...
-
监控应用场景声音事件数据集
2025年12月23日 30 164 157
数据集概述 该数据集包含用于监控应用场景的声音事件数据,分为训练集和测试集,涵盖无威胁、枪声、爆炸声、警报声等四类声音事件,所有音频为特定参数的WAV格式,整体打包为ZIP文件。 文件详解 文件名称: SESA.zip 文件格式: ZIP (.zip) 文件内容: 压缩包内包含两类文件夹: train: 480个WAV格式音频文件,单声道、16...
-
阿拉伯语语音命令数据集
2025年12月16日 30 123 36
数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
-
柏林情感语音数据库2_0
2025年12月10日 30 50 25
数据集概述 该数据集是柏林情感语音数据库2.0版本,包含十位演员(五位女性、五位男性)模拟七种情感录制的约八百句德语日常语句,同时记录了电声门图数据。数据按四位说话人划分为测试集、六位划分为训练集,音频为16kHz WAV格式,元信息采用audformat格式存储,还补充了模糊样本。 文件详解 文件名称: emodb_2.0.zip 文件格式:...



