-
Interruption_Based_手动标注会议打断音频转录数据集2024
2026年1月20日 30 126 75
数据集概述 本数据集改编自加拿大菲沙河谷大学创建的Group Affect and Performance数据集,包含手动标注的重叠话语(分为真实打断和非真实打断)音频文件、结构化标注数据及原始完整会议音频与转录文本。数据源于14组会议,从355个重叠话语实例中筛选出200个真实打断,支持对话打断行为的分析研究。 文件详解...
-
Turkish_Makam_Based_专业歌手演唱的无伴奏合唱片段数据集_2_0
2026年1月15日 30 22 17
数据集概述 本数据集为土耳其木卡姆(Turkish makam)风格的无伴奏合唱(acapella)片段录音集合,由专业歌手演唱,曲目选自声乐形式“şarkı”,与http://compmusic.upf.edu/turkish-sarki第二版录音对应,旨在为复调录音提供无伴奏合唱对照数据,包含音频及文本标注。 文件详解 文件名称:turkish-...
-
GiantSteps_电子舞曲调式数据集
2025年12月23日 30 61 31
数据集概述 该数据集包含六百个两分钟的电子舞曲(EDM)子流派音频片段,标注有单键标签。聚焦于Beatport平台上存在问题的片段,存在偏差,但可用于测试调式识别系统的鲁棒性。数据由Daniel G. Camhi和Ángel Faraldo分析,包含音高集合描述、调式变化、注释及置信度等信息。 文件详解 压缩文件:...
-
多歌声分离评估数据集_MedleyVox
2025年12月23日 30 209 45
数据集概述 该数据集是用于多歌声分离任务的评估数据集,包含三百八十一个音频片段(总时长约一点一小时),源自MedleyDB v1和v2的二十三首歌曲。数据集按歌声类型分为四类,为歌声分离算法的性能评估提供标准化测试数据。 文件详解 文件名称: MedleyVox.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
-
印度艺术音乐主音数据集
2025年12月21日 30 206 149
数据集概述 该数据集包含印度艺术音乐的音频片段及人工标注的主音音高数据,每个片段配有编辑元数据。数据支持开发和评估印度艺术音乐自动主音识别的计算方法,包含卡纳提克、印度斯坦等不同传统类型,覆盖声乐、器乐及不同性别歌手的音频,是该领域较大规模的主音识别数据集。 文件详解 核心压缩文件: indian_art_music_tonic_1.0.zip:...
-
土耳其Şarkı声乐数据集2_0
2025年12月21日 30 61 49
数据集概述 该数据集为土耳其传统声乐形式Şarkı的录音集合,包含11首作品的12段表演(8段女声、4段男声),并提供歌词短语与音频片段的对齐标注,支持音频与歌词的匹配研究。 文件详解 文件名称:turkish_sarki_vocal_v2.0.zip 文件格式:ZIP压缩包...
-
FOAMS_处理后音频文件数据集
2025年12月20日 30 56 50
数据集概述 本数据集是Free Open-Access Misophonia Stimuli(FOAMS)项目的一部分,包含为恐音症研究而精心整理的处理后音频刺激文件,旨在提供可免费获取的标准化声音刺激数据库,支持相关领域的研究工作。 文件详解 数据文件:...
-
印度艺术音乐旋律相似度数据集
2025年12月18日 30 148 107
数据集概述 该数据集包含印度卡纳提克音乐和印度斯坦音乐的音频片段及人工标注的旋律乐句,分为原始版本和改进版本,用于开发和评估印度艺术音乐短时旋律模式相似度计算方法,支持音乐信息检索领域的相关研究。 文件详解 该数据集分为卡纳提克音乐(CMD)和印度斯坦音乐(HMD)两部分,各歌曲文件夹包含以下文件: - 卡纳提克音乐(23个歌曲文件夹): -...
-
陆生哺乳动物地震脚步声识别数据集
2025年12月15日 30 81 66
数据集概述 本数据集包含北美四种陆生哺乳动物(黑熊、美洲狮、灰狼、白尾鹿)的地震脚步声录音,数据于大温哥华动物园采集,经处理后用于训练卷积神经网络模型进行物种识别。 文件详解 文件名称: dataset-audio.zip 文件格式: ZIP (.zip) 文件内容:...
-
咳嗽音频与时间戳数据集
2025年12月12日 30 25 13
数据集概述 本数据集包含从ESC-50和FSDKaggle2018数据集中提取的咳嗽音频文件及其对应的时间戳数据。核心内容为符合特定咳嗽模板的音频片段(WAV格式),以及记录这些片段起止时间的结构化表格,为咳嗽检测相关研究提供标注数据支持。 文件详解 文件名称: timestamps.csv 文件格式: CSV(逗号分隔值) 字段映射:...
-
家庭环境音频事件分类的开集识别与少样本学习数据集
2025年12月11日 30 36 28
数据集概述 该数据集聚焦家庭环境音频事件分类,包含34类共1360条音频片段,分为模式声音和干扰声音两类。专为开集识别(OSR)和少样本学习(FSL)任务设计,提供两种基线系统结果,解决音频领域少样本学习专用数据集缺失问题。 文件详解 文件名称:Open-set_Recognition_Few-...
-
Zenodo_DCASE2024Task7_Based_文本提示环境声音合成完整数据集
2025年12月7日 30 165 63
数据集概述 本数据集包含三百一十组音频片段与对应文本提示,音频时长均为四秒。所有内容经人工精心设计,支持环境声音场景合成任务的生成模型开发与评估。数据分为开发集与评估集,结构清晰,可实现对生成模型的可控量化评估。 文件详解 数据集以压缩包形式提供,解压后包含以下目录结构: - 开发集目录(dev/): - audio/:存放开发集的WAV格式音频文件...
-
斯洛文尼亚草原栖息地振动信号类型数据集
2025年12月5日 30 78 64
数据集概述 该数据集是 López Díez J.J. 等人2025年发表研究的配套数据,包含从斯洛文尼亚Bistra和Krkavče两个草原栖息地振动景观(vibroscape)录音中提取的已识别振动信号类型(VSTs)音频片段,为草原栖息地振动信号研究提供支持。 文件详解 文件名称: Original.zip 文件格式: .zip 内容说明:...



