-
意大利自然语言语音识别数据集
2025年12月21日 30 194 75
数据集概述 该数据集收集意大利自然语言说话者的音频记录,用于训练和测试智能家居场景下AXIOM开发板的VIMAR算法,目标是开发高效语音识别系统。数据由锡耶纳大学UX研究团队收集五个月,参与者覆盖不同性别、年龄、地区及背景。 文件详解 音频压缩包: AXIOM audio.zip:ZIP格式,包含意大利自然语言说话者的音频记录样本 Axiom...
-
土耳其Şarkı声乐数据集2_0
2025年12月21日 30 55 51
数据集概述 该数据集为土耳其传统声乐形式Şarkı的录音集合,包含11首作品的12段表演(8段女声、4段男声),并提供歌词短语与音频片段的对齐标注,支持音频与歌词的匹配研究。 文件详解 文件名称:turkish_sarki_vocal_v2.0.zip 文件格式:ZIP压缩包...
-
听觉与运动皮层中语音跟踪的感知相关性数据集2018
2025年12月20日 30 125 30
数据集概述 本数据集包含语音跟踪研究的相关文件,聚焦听觉与运动皮层中不同语言特征(短语、词、音节、音素)对应的语音跟踪现象,分析其感知相关性及跨频率耦合机制,为语音处理神经机制研究提供数据支持。 文件详解...
-
业余人声打击乐数据集
2025年12月20日 30 98 52
数据集概述 该数据集包含业余人员对打击乐声音的人声模仿数据,共9780段发声,280个音频文件,由28名无或少量beatbox经验的参与者录制。数据集标注了底鼓、军鼓、闭合踩镲、开放踩镲的起始点及标签,还包含起始音素和结尾音素标签及噪声样本音频文件。 文件详解 压缩包文件: AVP_Dataset.zip: ZIP格式压缩包,包含所有音频文件和标注文件...
-
Zenodo_Komnzo_Text_Corpus_Based_202406语言语料库完整数据
2025年12月20日 30 123 104
数据集概述 本数据集包含最新版本的Komnzo文本语料库压缩文件,由Christian Döhler为其博士语言记录项目录制,记录了新几内亚南部的Komnzo语言相关材料。 文件详解 文件名称: Komnzo-2024-06.zip 文件格式: ZIP(压缩文件) 内容说明:...
-
可变强度情感与情绪发声语料库VIVAE
2025年12月20日 30 138 71
数据集概述 该数据集包含人类非言语情感发声录音,分为全量集(一千零八十五个音频文件)和核心集(四百八十个音频文件)。全量集涵盖十一位说话者表达的六种情感(三种积极、三种消极),每种情感包含从低到峰值的强度变化;核心集为基于真实性判断筛选的交叉子样本,为情感发声研究提供标准化数据支持。 文件详解 压缩包文件: VIVAE.zip:...
-
语音增强的Open_Unmix权重数据集
2025年12月20日 30 202 27
数据集概述 本数据集包含基于Voicebank+Demand(二十八说话人版本)训练的Open-Unmix语音增强模型权重,采样率为一万六千赫兹。数据文件类型多样,可适配open-unmix-nnabla与open-unmix-pytorch框架使用。 文件详解 模型权重文件(.pth格式): noise_04a6fc2d.pth:噪声分离模型权重文件...
-
奥斯曼_土耳其调式音乐作品识别结果数据集
2025年12月20日 30 58 20
数据集概述 本数据集包含奥斯曼-土耳其调式音乐作品识别与主音识别结果,以及相关统计显著性数值,对应Şentürk与Serra 2016年发表的研究论文成果,为该领域的研究提供实证数据支持。 文件详解 文件名称:LICENSE.txt 文件格式:TXT(.txt) 内容说明:Creative Commons Attribution-...
-
ESMA_3D沉浸式声景录音数据集
2025年12月20日 0 7 6
数据集概述 该数据集包含基于ESMA-3D麦克风阵列技术录制的沉浸式声景音频。ESMA-3D技术采用8麦克风分层设计,可实现360°空间音频捕捉,具有良好的空间感和稳定的水平/垂直定位效果,适用于沉浸式音频研究与应用。 文件详解 文件名称:ESMA-3D Immersive Soundscape_Manhattan NYC.zip...
-
简单鞋盒形房间脉冲响应生成方法比较数据集
2025年12月19日 30 28 0
数据集概述 本数据集包含为论文《Comparison of Impulse Response Generation Methods for a Simple Shoe-box Shaped Room》生成的记录与合成脉冲响应数据,可用于研究不同方法在简单鞋盒形房间场景下的脉冲响应生成效果。 文件详解 文件名称:Impulse Responses.zip...
-
瓦努阿图之声数据集2024
2025年12月19日 30 175 161
数据集概述 该数据集为“瓦努阿图之声”项目数据,核心包含与瓦努阿图相关的语音音频内容,以压缩包形式存储,未提供具体内容预览,整体结构简洁,无训练测试或原始处理数据的拆分。 文件详解 文件名称: lexibank/vanuatuvoices-v1.3.zip 文件格式: ZIP (.zip) 文件说明:...
-
交响音乐录音旋律提取数据集ORCHSET
2025年12月19日 30 120 46
数据集概述 该数据集是用于旋律提取算法开发与评估的专业数据集,包含64段交响音乐音频片段及其对应的旋律标注。旋律定义为听众在复调音乐中会哼唱或吹奏的单音高序列,为相关算法研究提供标准化测试数据。 文件详解 文件名称: Orchset_dataset_0.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...
-
自动音频转录工具概述及转录文本数据集2022
2025年12月19日 30 108 84
数据集概述 本数据集包含2022年3月对多款自动音频转录工具的综合评估,涉及工具功能、成本、安全性等信息,同时提供荷兰语测试音频片段及各工具生成的原始转录文本与人工清理文本,为研究自动转录工具性能提供实证数据。 文件详解 工具概述文件...
-
昂库语族初步调查数据集
2025年12月18日 30 190 173
数据集概述 本数据集围绕昂库语族(属于南亚语系孟高棉语支)展开初步调查,包含未记录语言的词汇、语音数据及地理分布信息,为研究该语族分类、语言特征及演化提供基础资料。 文件详解 文件名称:AngkuicComparative.xlsx 文件格式:Excel(.xlsx) 内容说明:可能包含昂库语族不同语言的词汇比较数据表 文件名称:Angkuic2...
-
儿童英语语音录音数据集_自发语音_预设句子
2025年12月16日 30 188 47
数据集概述 该数据集包含11名幼儿(平均年龄4.9岁,5名女性、6名男性)的英语语音录音,涵盖自发讲述绘本、重复预设句子、数数三类任务,录音来源包括专业麦克风、便携麦克风及机器人麦克风,部分组合因技术问题缺失,含自发语音的人工分割标注。 文件详解 文件名称: english_children.zip 文件格式: ZIP压缩包 内容说明:...
-
德语短语结构与元音松紧度交互作用声学与发音研究数据集
2025年12月18日 30 14 12
数据集概述 该数据集是研究“德语短语结构与元音松紧度交互作用”的声学与发音学研究配套数据,包含实验数据文件和分析脚本,支持对德语语音结构与元音特征关系的定量分析。 文件详解 文本数据文件(.txt格式,共5个): di.txt、mono.txt:包含语音标注数据,字段示例有labels、start、end、utts、subject等时间与对象信息...
-
Seeing_Sound_Dataset_Based_合成音景与音频标注完整数据
2025年12月18日 30 127 44
数据集概述 本数据集包含合成音景及众包音频标注数据,支撑研究音景复杂度与声音可视化对声音事件标注质量及速度的影响。数据涵盖不同复杂度维度(最大复调、基尼复调)的合成音景及对应标注结果。 文件详解 文件名称: seeing-sound-dataset-v1.0.1.zip 文件格式: ZIP压缩包 内容说明:...
-
维京人头相关传输函数数据集第二版
2025年12月13日 30 106 43
数据集概述 该数据集是冰岛大学测量的头相关传输函数(HRTF)集合,包含在密集空间网格(一千五百一十三个位置)上测量的全球面HRTF数据,使用佩戴不同人工耳廓对的KEMAR人体模型,人工耳廓由雷克雅未克萨迦博物馆提供的真人头部模型定制而成。 文件详解 压缩文件: 3D_scans.zip:...
-
LJ语音_国际音标对齐转录数据集
2025年12月11日 30 97 78
数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
-
TimeSide_API音频处理网络服务演示文档
2025年12月7日 30 34 22
数据集概述 本数据集为一份演示文档,介绍如何使用TimeSide REST API作为远程服务处理音频描述符,以将分析结果嵌入网页应用。文档还展示了新版TimeSide播放器作为使用JavaScript SDK开发可视化与协作标注应用的示例。 文件详解 文件名称:WAC_2022_paper_47 (1).pdf 文件格式:PDF...



