-
SELDnet_Based声音事件定位检测联合测量结果数据2019
2026年2月6日 0 82 77
数据集概述 本数据集为SELDnet方法在声音事件定位与检测任务中的结果,对应5、25、75个训练周期的不同状态,基于TAU Spatial Sound Events 2019麦克风阵列数据集的四组交叉验证分割数据生成,含4个文件,用于支持声音事件定位与检测的技术研究。 文件详解 压缩文件组(Archive files)...
-
IDMT_Source_深度学习音频效果黑箱建模研究数据_2019
2026年2月6日 0 100 51
数据集概述 本数据集是论文“Deep Learning for Black-Box Modeling of Audio Effects”的配套音频样本,包含贝斯和吉他的干声与湿声录音。干声源自IDMT-SMT-Audio-Effects数据集,湿声由Universal Audio 6176设备及145...
-
Unmixing_Addendum_单通道盲音频源分离听感测试补充数据
2026年2月6日 0 112 72
数据集概述 本数据集为Toby Stokes博士项目“Improving the perceptual quality of single-channel blind audio source separation”的补充档案,包含听感测试代码与数据,用于补充原音频分离研究数据,支持单通道盲音频源分离的感知质量分析。 文件详解...
-
京剧无伴奏清唱音节边界与时值标注zip文件
2026年2月1日 0 134 27
数据集概述 本数据集包含京剧专业及业余演唱者无伴奏演唱的音节边界标注与音节时长标注,是相关研究的实验数据。数据集整合了音频文件与标注文件,音频由C4DM Queen Mary University of London和MTG-UPF两所机构录制,标注采用Textgrid和CSV格式,同时提供解析代码。 文件详解...
-
CSIBE_卧室常见声音事件识别数据集2018
2026年2月1日 30 94 21
数据集概述 本数据集为卧室常见声音事件识别数据集(CSIBE),包含人类语音、婴儿哭声、猫叫、狗吠等14类主要声音事件,以及门、抽屉、键盘等14类背景环境声音。数据集分为原始音频(CSIBE-RAW)和机器人录制音频(CSIBE-AIBO)两部分,可用于智能家居场景下的声音事件识别研究。 文件详解 CSIBE-RAW...
-
EMOSEC_Based_双语语音情感描述数据集
2026年2月1日 30 19 7
数据集概述 本数据集为基于ESD和IEMOCAP数据集构建的中英双语语音情感描述数据集,整合了语音数据与对应的情感描述内容,以单一JSON文件形式提供,未划分训练/测试集或数据/标签集。 文件详解 文件名称:merged_file.json 文件格式:JSON...
-
EMOSEC_Based_中英语音情感描述数据集
2026年2月1日 30 181 157
数据集概述 本数据集为EMOSEC Dataset,是基于ESD和IEMOCAP数据集构建的中英双语语音情感描述数据集,包含中文和英文的语音情感描述内容,以合并后的JSON文件形式提供,可用于语音情感分析相关研究。 文件详解 文件名称:merged_file.json 文件格式:JSON...
-
TRIOS_Based_乐谱对齐音乐多轨录音数据集
2026年1月31日 0 33 31
数据集概述 本数据集为乐谱对齐的多轨录音数据集,包含5首室内乐三重奏作品的分离音轨及对齐的MIDI乐谱,可支持乐谱引导源分离、自动音乐转录等音乐研究任务,数据集整体打包为一个压缩文件。 文件详解 文件名称:TRIOS Dataset.zip 文件格式:ZIP...
-
NUBUC_Based_语境控制口语故事语料库数据
2026年1月31日 30 76 55
数据集概述 本数据集为NyU-BU语境控制故事语料库(NUBUC),是兼顾自然性与实验可控性的口语语料库。包含8个独特故事的16段高质量录音,由男女演员各录制一遍,每故事含128句约2000词,围绕关键词构建,关键词在多语言维度匹配,语境参数(先验/局部语境强弱、句子位置早晚)被操控。 文件详解 文件名称:public.zip 文件格式:ZIP...
-
FeatureTTS_Based_音系特征映射数据
2026年1月31日 30 34 13
数据集概述 本数据集为FeatureTTS相关的音系特征映射数据,包含APRAbet与SAMPA、拼音与SAMPA-SC、SAMPA/SAMPA-SC与基于FUL的音系特征之间的映射关系,用于语音合成领域的音系特征转换与处理。 文件详解 文件名称:CMU2SAMPA_Pinyin2SAMPA_SAMPA2Features.xlsx 文件格式:XLSX...
-
MowIT_Based_农业机器人声音异常检测数据集
2026年1月31日 30 86 80
数据集概述 本数据集包含农业机器人MowIT割草工具的声音异常检测相关数据,通过两个麦克风采集单通道音频(采样率44100Hz、16位分辨率),同时记录集成的惯性测量单元(IMU)数据。数据在两种户外草地环境下采集,涵盖不同切割工具(修剪线、刀片)、配置组合及异常状态(电机压力停机等),为农业机器人声音异常检测提供实验数据。 文件详解...
-
ICASSP_Based_板弹簧混响建模音频样本数据
2026年1月31日 30 133 65
数据集概述 本数据集是ICASSP 2020论文《Modeling plate and spring reverberation using a DSP-informed deep neural network》的配套音频样本,包含干、湿两种状态的贝斯和吉他录音,涵盖板混响(VST插件生成)与弹簧混响(Accutronics...
-
PB2007_Based_法语声学_发音同步语音数据集
2026年1月31日 30 164 72
数据集概述 本数据集为PB2007法语声学-发音语音数据库,包含法语语音的声学信号与电磁发音仪(EMA)记录的发音运动数据,同步采集自法语受试者,支持语音生产机制研究与声学-发音转换模型开发。 文件详解 _seq/目录 内容:电磁发音仪(EMA)数据,采样频率100Hz...
-
Ihanzu_ELAR_词汇诱导会话修改版音频处理教程数据
2026年1月30日 30 146 23
数据集概述 本数据集为Andrew Harvey开展的3次Ihanzu词汇诱导会话的修改版本,原始数据来自濒危语言档案库(ELAR)。数据已重采样为16 kHz单声道16位PCM格式,适用于音频处理教程,包含3个文件,可通过Zenodo获取。 文件详解 文件名称:ihanzu-harvey-0596_20180518opq.zip 文件格式:ZIP...
-
SPECS_Based_语音风格关键词采集与背景噪声数据集
2026年1月29日 30 175 150
数据集概述 本数据集包含命令风格语音关键词(ck)、扩展命令风格语音关键词(eck)、对话风格语音(cs)三个子集及背景噪声文件夹,用于关键词识别和语音风格分析研究。所有语音为用户在安静环境下录制的16kHz 32位PCM WAV文件,背景噪声源自Google语音命令集。 文件详解 主文件 文件名称:SPECS.zip 文件格式:ZIP...
-
lexibank_Papuan_Voices巴布亚语音数据集
2026年1月29日 30 13 4
数据集概述 本数据集为Papuan Voices语音数据,包含一份压缩文件,主要内容涉及巴布亚地区的语音记录,属于语言类数据集,可用于语言学相关研究与分析。 文件详解 文件名称:lexibank/papuanvoices-v1.2.zip 文件格式:ZIP...
-
MAVC100_Based_音乐视听语音活动检测帧级标注数据集
2026年1月29日 30 196 52
数据集概述 本数据集为MAVC100音乐视听语料库,包含一百分钟音乐视听内容及帧级标注。标注分为音频标签与视听标签两类,前者覆盖音频流中所有语音、歌唱等事件,后者仅标记目标说话人的语音与歌唱。数据支持音乐场景下的语音活动检测研究。 文件详解 文件名称:Open_dataset_MAVC100.zip 文件格式:ZIP...
-
-
Prosodic_Based_词切分任务韵律边界线索逆相关研究数据
2026年1月27日 30 45 2
数据集概述 本数据集包含韵律逆相关研究中使用的刺激材料、原始数据和后处理数据,研究主题为词切分任务中的词边界韵律线索。实验采用单区间试次设计,目标词结构为l'aX和la'X,共47名参与者分5种条件参与,实验通过fastACI工具箱实现,数据集含4个文件。 文件详解 刺激材料文件: 文件名称:01-Stimuli.zip 文件格式:ZIP...
-
is24_Interspeech2024_欧洲议会录音多语言测试集
2026年1月27日 30 159 12
数据集概述 本数据集是从欧洲议会会议录音中提取的多语言测试集,用于语言识别和语音识别任务。包含15个多语言音频文件,总时长约2小时56分34秒,覆盖19种语言,经人工核对语言标签时间戳并补充官方文本转录,可支持多语言语音技术的模型测试与评估。 文件详解 文件名称:tst_is24.zip 文件格式:ZIP...



