-
生成式歌声分离模型客观评估指标数据集
数据集概述 本数据集为WASPAA 2025相关论文的配套数据,包含用于计算生成式歌声分离模型客观评估指标的音频数据、DCR测试用响度归一化刺激音频、含DMOS分数与指标的CSV文件及SRCC计算演示Python脚本,提供完整评估资源。 文件详解 文件名称: gensvs_eval_data.zip 文件格式: ZIP压缩包 包含内容:...
-
TUT声音事件2016评估数据集
数据集概述 该数据集为TUT声音事件2016评估数据集,包含家庭(室内)和居民区(室外)两个声学场景的音频记录,共十个音频文件,室内与室外各五个,总时长均为十七分四十九秒。 文件详解 该数据集包含三个压缩文件,具体说明如下: - TUT-sound-events-2016-evaluation.audio.zip:压缩格式文件,可能包含音频数据文件 -...
-
非局部平均修剪重分配谱图_声门脉冲可视化与分析的数据和代码
数据集概述 本数据集包含复现标题论文中所有图表所需的数据和代码,核心围绕非局部平均修剪重分配谱图方法,为声门脉冲的可视化与分析提供技术实现支持。 文件详解 AUDIO.zip: 压缩包文件,可能包含用于分析的音频数据 NAPReS_Final.m: MATLAB代码文件,用于实现非局部平均修剪重分配谱图方法及相关分析 适用场景...
-
SynthSOD_Aligned_Scores_Based_乐谱引导音乐源分离完整数据
数据集概述 该数据集包含SynthSOD中约百分之八十五歌曲的对齐乐谱分数,用于训练分数引导的音乐源分离模型。乐谱信息来自合成SynthSOD的原始MIDI文件,经特定系统对齐,包含音符时间、音高、乐器编码及元数据文件。 文件详解 文件名称:SynthSOD_aligned_scores.zip 文件格式:ZIP压缩包(.zip)...
-
TUT声音事件2017评估数据集
数据集概述 本数据集为TUT声音事件2017评估数据集,包含来自单一声学场景(街道户外)的8段音频录音,总时长约二十九分零九秒,以压缩文件形式存储相关评估数据。 文件详解 文件名称:TUT-sound-events-2017-evaluation.meta.zip,文件格式:.zip,可能包含数据集的元数据信息 文件名称:TUT-sound-...
-
音频与屏幕录制数据关键片段
数据集概述 本数据集包含从研究期间收集的音频与屏幕录制数据中提取的关键片段,以PDF文档形式呈现,为分析研究过程中的重要记录提供支持。 文件详解 文件名称:Critical episodes from screen and audio recordings.pdf 文件格式:PDF(.pdf)...
-
教室环境音频与三维模型数据集
数据集概述 该数据集包含荷兰小学教室的环境音频(含儿童嘈杂声、房间脉冲响应)及教室三维模型,音频采用Ambisonics格式存储,模型提供Blender和OBJ文件,为虚拟教室环境构建提供多模态数据支持。 文件详解 文档文件: Classroom Environment Description Document...
-
Kingsbarns_202106_PASS_Sample_Based_环境声学地理研究完整数据集
数据集概述 该数据集包含2021年6月21日在苏格兰Kingsbarns地区采集的PASS样本数据,涵盖CSV格式的样本信息表、WAV格式的音频文件及JPG格式的图片文件,为相关环境或声学研究提供多类型数据支持。 文件详解...
-
工业泵音频故障检测数据集
数据集概述 本数据集围绕工业泵的音频故障检测展开,包含基于PANNs(CNN14模型)和XGBoost算法的相关数据文件,为研究音频分析在设备故障检测与预测性维护中的应用提供支持。 文件详解 压缩文件: libs.zip: ZIP格式压缩文件,可能包含项目所需的库文件或依赖包 features.zip:...
-
英国鸟类鸣叫声数据集
英国鸟类鸣叫声数据集_British_Birdsong_Dataset 数据来源:互联网公开数据 标签:鸟类, 声音识别, 生物多样性, 鸣叫声, 声音分析, 音频数据, 机器学习, 生态研究 数据概述: 该数据集包含来自英国的鸟类鸣叫声录音及其元数据,旨在为研究鸟类声音、生物多样性和生态学提供支持。主要特征如下:...
-
口音识别音频数据集
口音识别音频数据集_Accent_Recognition_Audio_Dataset 数据来源:互联网公开数据 标签:语音识别, 口音识别, 音频数据, 机器学习, 语音分析, 多语言, 声学特征, 数据标注 数据概述: 该数据集包含来自多个来源的音频文件,记录了不同口音的语音样本,用于口音识别研究和模型训练。主要特征如下:...
-
英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1
英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1 数据来源:互联网公开数据 标签:语音合成, 文本转语音, 语音识别, 自然语言处理, 音频数据, LJSpeech, 数据集, 深度学习 数据概述:...
-
语音情感识别评估数据集
语音情感识别评估数据集_Speech_Emotion_Recognition_Assessment_Dataset 数据来源:互联网公开数据 标签:语音识别, 情感分析, 语音情感, 机器学习, 音频数据, 情感分类, 深度学习, 评估 数据概述: 该数据集包含来自公开渠道的语音数据,主要用于语音情感识别模型的评估。主要特征如下:...
-
多语言语音词汇识别数据集
多语言语音词汇识别数据集_Multilingual_Speech_Word_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 多语言, 词汇识别, 语音标注, 自然语言处理, 音频数据, 机器学习, 语音数据集 数据概述: 该数据集包含来自多个来源的语音数据,记录了不同语言的语音词汇及其对应的文本转录。主要特征如下:...
-
情感语音识别音频数据集
情感语音识别音频数据集_Emotion_Voice_Recognition_Audio_Dataset 数据来源:互联网公开数据 标签:语音识别, 情感分析, 音频数据, 机器学习, 情感分类, 声音信号处理, 深度学习, 声音情感 数据概述: 该数据集包含来自公开渠道的情感语音音频文件,记录了不同情感状态下的语音样本。主要特征如下:...
-
鸟类声音地理信息数据集
鸟类声音地理信息数据集_Birdsong_Geo_Information_Dataset 数据来源:互联网公开数据 标签:鸟类声音, 生物多样性, 声学分析, 地理信息, FLAC, 音频数据, 物种识别, 机器学习 数据概述: 该数据集包含来自开放音频资源库的鸟类声音数据,记录了不同鸟类物种的录音及其对应的地理位置信息。主要特征如下:...
-
埃及阿拉伯语语音数据集
埃及阿拉伯语语音数据集 数据来源:互联网公开数据 标签:语音识别,音频数据,阿拉伯语,埃及,语音采集,多领域语音,发音特征 数据概述: 本数据集由从 YouTube...
-
波斯语自动语音识别清洁数据集-2021-pouyatoroghi
波斯语自动语音识别清洁数据集-2021-pouyatoroghi 数据来源:互联网公开数据 标签:波斯语,自动语音识别,音频数据,语音识别,ASR,噪声处理,语音数据,训练集 数据概述:...
-
巴西儿童心脏杂音筛查心音图数据集-2014-2015-bjoernjostein
巴西儿童心脏杂音筛查心音图数据集-2014-2015-bjoernjostein 数据来源:互联网公开数据 标签:心音图,心脏杂音,儿童,筛查,巴西,医学,健康,临床,音频数据 数据概述:...
-
英国鸟类识别应用音频数据集-2018
英国鸟类识别应用音频数据集-2018 数据来源:互联网公开数据 标签:音频数据,鸟类识别,环境声音,噪音分析,公众参与,科学研究,DCASE2018 数据概述: 本数据集是Crowdsourced dataset,...



