数据集 - 海数据

生成式歌声分离模型客观评估指标数据集

2025年12月14日

数据集概述本数据集为WASPAA 2025相关论文的配套数据，包含用于计算生成式歌声分离模型客观评估指标的音频数据、DCR测试用响度归一化刺激音频、含DMOS分数与指标的CSV文件及SRCC计算演示Python脚本，提供完整评估资源。文件详解文件名称: gensvs_eval_data.zip 文件格式: ZIP压缩包包含内容:...

ZIP

TUT声音事件2016评估数据集

2025年12月13日

数据集概述该数据集为TUT声音事件2016评估数据集，包含家庭（室内）和居民区（室外）两个声学场景的音频记录，共十个音频文件，室内与室外各五个，总时长均为十七分四十九秒。文件详解该数据集包含三个压缩文件，具体说明如下： - TUT-sound-events-2016-evaluation.audio.zip：压缩格式文件，可能包含音频数据文件 -...

ZIP

非局部平均修剪重分配谱图_声门脉冲可视化与分析的数据和代码

2025年12月13日

数据集概述本数据集包含复现标题论文中所有图表所需的数据和代码，核心围绕非局部平均修剪重分配谱图方法，为声门脉冲的可视化与分析提供技术实现支持。文件详解 AUDIO.zip: 压缩包文件，可能包含用于分析的音频数据 NAPReS_Final.m: MATLAB代码文件，用于实现非局部平均修剪重分配谱图方法及相关分析适用场景...

ZIP

SynthSOD_Aligned_Scores_Based_乐谱引导音乐源分离完整数据

2025年12月10日

数据集概述该数据集包含SynthSOD中约百分之八十五歌曲的对齐乐谱分数，用于训练分数引导的音乐源分离模型。乐谱信息来自合成SynthSOD的原始MIDI文件，经特定系统对齐，包含音符时间、音高、乐器编码及元数据文件。文件详解文件名称：SynthSOD_aligned_scores.zip 文件格式：ZIP压缩包（.zip）...

ZIP

TUT声音事件2017评估数据集

2025年12月7日

数据集概述本数据集为TUT声音事件2017评估数据集，包含来自单一声学场景（街道户外）的8段音频录音，总时长约二十九分零九秒，以压缩文件形式存储相关评估数据。文件详解文件名称：TUT-sound-events-2017-evaluation.meta.zip，文件格式：.zip，可能包含数据集的元数据信息文件名称：TUT-sound-...

ZIP

音频与屏幕录制数据关键片段

2025年12月6日

数据集概述本数据集包含从研究期间收集的音频与屏幕录制数据中提取的关键片段，以PDF文档形式呈现，为分析研究过程中的重要记录提供支持。文件详解文件名称：Critical episodes from screen and audio recordings.pdf 文件格式：PDF（.pdf）...

ZIP

教室环境音频与三维模型数据集

2025年12月5日

数据集概述该数据集包含荷兰小学教室的环境音频（含儿童嘈杂声、房间脉冲响应）及教室三维模型，音频采用Ambisonics格式存储，模型提供Blender和OBJ文件，为虚拟教室环境构建提供多模态数据支持。文件详解文档文件： Classroom Environment Description Document...

ZIP

Kingsbarns_202106_PASS_Sample_Based_环境声学地理研究完整数据集

2025年12月4日

数据集概述该数据集包含2021年6月21日在苏格兰Kingsbarns地区采集的PASS样本数据，涵盖CSV格式的样本信息表、WAV格式的音频文件及JPG格式的图片文件，为相关环境或声学研究提供多类型数据支持。文件详解...

ZIP

工业泵音频故障检测数据集

2025年12月4日

数据集概述本数据集围绕工业泵的音频故障检测展开，包含基于PANNs（CNN14模型）和XGBoost算法的相关数据文件，为研究音频分析在设备故障检测与预测性维护中的应用提供支持。文件详解压缩文件: libs.zip: ZIP格式压缩文件，可能包含项目所需的库文件或依赖包 features.zip:...

ZIP

英国鸟类鸣叫声数据集

2025年9月5日

英国鸟类鸣叫声数据集_British_Birdsong_Dataset 数据来源：互联网公开数据标签：鸟类, 声音识别, 生物多样性, 鸣叫声, 声音分析, 音频数据, 机器学习, 生态研究数据概述：该数据集包含来自英国的鸟类鸣叫声录音及其元数据，旨在为研究鸟类声音、生物多样性和生态学提供支持。主要特征如下：...

ZIP

口音识别音频数据集

2025年8月30日

口音识别音频数据集_Accent_Recognition_Audio_Dataset 数据来源：互联网公开数据标签：语音识别, 口音识别, 音频数据, 机器学习, 语音分析, 多语言, 声学特征, 数据标注数据概述：该数据集包含来自多个来源的音频文件，记录了不同口音的语音样本，用于口音识别研究和模型训练。主要特征如下：...

ZIP

英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1

2025年5月28日

英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1 数据来源：互联网公开数据标签：语音合成, 文本转语音, 语音识别, 自然语言处理, 音频数据, LJSpeech, 数据集, 深度学习数据概述：...

ZIP

语音情感识别评估数据集

2025年7月31日

语音情感识别评估数据集_Speech_Emotion_Recognition_Assessment_Dataset 数据来源：互联网公开数据标签：语音识别, 情感分析, 语音情感, 机器学习, 音频数据, 情感分类, 深度学习, 评估数据概述：该数据集包含来自公开渠道的语音数据，主要用于语音情感识别模型的评估。主要特征如下：...

ZIP

多语言语音词汇识别数据集

2025年7月24日

多语言语音词汇识别数据集_Multilingual_Speech_Word_Recognition_Dataset 数据来源：互联网公开数据标签：语音识别, 多语言, 词汇识别, 语音标注, 自然语言处理, 音频数据, 机器学习, 语音数据集数据概述：该数据集包含来自多个来源的语音数据，记录了不同语言的语音词汇及其对应的文本转录。主要特征如下：...

ZIP

情感语音识别音频数据集

2025年7月17日

情感语音识别音频数据集_Emotion_Voice_Recognition_Audio_Dataset 数据来源：互联网公开数据标签：语音识别, 情感分析, 音频数据, 机器学习, 情感分类, 声音信号处理, 深度学习, 声音情感数据概述：该数据集包含来自公开渠道的情感语音音频文件，记录了不同情感状态下的语音样本。主要特征如下：...

ZIP

鸟类声音地理信息数据集

2025年7月7日

鸟类声音地理信息数据集_Birdsong_Geo_Information_Dataset 数据来源：互联网公开数据标签：鸟类声音, 生物多样性, 声学分析, 地理信息, FLAC, 音频数据, 物种识别, 机器学习数据概述：该数据集包含来自开放音频资源库的鸟类声音数据，记录了不同鸟类物种的录音及其对应的地理位置信息。主要特征如下：...