-
MAVC100_Based_音乐视听语音活动检测帧级标注数据集
数据集概述 本数据集为MAVC100音乐视听语料库,包含一百分钟音乐视听内容及帧级标注。标注分为音频标签与视听标签两类,前者覆盖音频流中所有语音、歌唱等事件,后者仅标记目标说话人的语音与歌唱。数据支持音乐场景下的语音活动检测研究。 文件详解 文件名称:Open_dataset_MAVC100.zip 文件格式:ZIP...
-
Prosodic_Based_词切分任务韵律边界线索逆相关研究数据
数据集概述 本数据集包含韵律逆相关研究中使用的刺激材料、原始数据和后处理数据,研究主题为词切分任务中的词边界韵律线索。实验采用单区间试次设计,目标词结构为l'aX和la'X,共47名参与者分5种条件参与,实验通过fastACI工具箱实现,数据集含4个文件。 文件详解 刺激材料文件: 文件名称:01-Stimuli.zip 文件格式:ZIP...
-
is24_Interspeech2024_欧洲议会录音多语言测试集
数据集概述 本数据集是从欧洲议会会议录音中提取的多语言测试集,用于语言识别和语音识别任务。包含15个多语言音频文件,总时长约2小时56分34秒,覆盖19种语言,经人工核对语言标签时间戳并补充官方文本转录,可支持多语言语音技术的模型测试与评估。 文件详解 文件名称:tst_is24.zip 文件格式:ZIP...
-
PHOIBLE_Online_Based_语音数据库数据_2014版
数据集概述 本数据集为PHOIBLE Online语音数据库2014版,由Steven Moran、Daniel McCloy和Richard Wright主编,包含全球语言的语音系统数据,是语言学领域研究语音多样性的基础资源,仅含一个压缩文件。 文件详解 文件名称:phoible-v2014.zip 文件格式:ZIP(压缩包)...
-
IPA_Transcription_印尼西芒加莱方言语音转录与录音数据
数据集概述 本数据集包含印度尼西亚东努沙登加拉省西芒加莱地区十个调查点的方言语音数据,采用国际音标(IPA)进行转录,同时提供对应的语音录音文件,可用于方言语音特征分析与研究,总计包含十七个文件。 文件详解 语音录音文件(MP3格式) 文件名称:包含sample of [e] sound in gloss fish.mp3、sample of [h]...
-
Minspeech_Source_闽南语语音识别语料库数据v1_0_0
数据集概述 本数据集为闽南语方言语音识别语料库(Minspeech v1.0.0),包含用于自动语音识别的闽南语语音数据,整体以压缩包形式存储,未划分训练/测试集、数据/标签集及原始/处理数据,无额外目录层级。 文件详解 文件名称:Minspeech-1.0.0.zip 文件格式:ZIP...
-
Gronings_Based_低资源语言口语术语检测特征提取方法评估数据集
数据集概述 本数据集用于评估低资源语言下基于示例查询的口语术语检测(QBE-STD)的特征提取方法,核心围绕Gronings语言相关的检测任务,通过单一压缩文件提供数据支持,可结合GitHub仓库的README获取详细信息。 文件详解 文件名称:gos-kdl.zip 文件格式:ZIP...
-
Fongbe_Speech_Dataset_贝宁Fongbe语言语音数据集
数据集概述 本数据集为贝宁主要使用的Fongbe语言语音数据集,包含语音音频文件、对应转录文本、数据集文档及元数据文件,用于支持Fongbe语言相关的语音技术研究与应用开发。 文件详解 压缩包文件 文件名称:Fongbe_Speech_Dataset.zip 文件格式:ZIP 字段映射介绍:压缩包内包含三个核心部分:...
-
Schuessler_Appendix_汉代外来名称与词汇转写数据集
数据集概述 本数据集包含汉代文献中外来名称与词汇的中文转写内容,源自Axel Schuessler 2014年论文的附录。数据覆盖先秦、西汉、东汉三个时期,记录了外来词的汉字形式、拼音、上古音重构、时间、出处、释义等信息,共8个文件,支持历史语言学领域的汉代语言接触研究。 文件详解 数据文件(共6个) 先秦时期文件:1...
-
CLDF_Derived_声音象征类型学语义与语音特征数据集2020
数据集概述 本数据集是基于Johansson等人2020年发表的《声音象征类型学》研究生成的CLDF格式数据集,核心内容为通过语义和语音特征定义宏观概念的声音象征类型学研究数据,包含一个压缩文件,便于语言类型学领域的研究与分析。 文件详解 压缩文件 文件名称:lexibank/johanssonsoundsymbolic-v1.3.zip...
-
CCSM_Based_声音质量心理声学测量数据库_人工与真实声音数据
数据集概述 本数据集为声音质量并发分类标度(CCSM)数据库,包含129个人工与真实声音的心理声学测量数据,涵盖粗糙度、尖锐度、音调、响度和烦扰度五个指标。通过正常听力听众的分类标度评估及工具测量获取,多数声音的工具响度已均衡,以减少响度对其他指标的影响。 文件详解...
-
Accent_Classification_Dataset_英国口音分类音频数据集2020
数据集概述 本数据集包含英国12种不同口音的音频记录,性别比例为1:1,标注为“_M”(男性)或“_F”(女性)。音频时长30秒,首尾5秒为空白,重采样至8 kHz。还包含谷歌开源数字数据集(1-9),用于测试模型对数据变化的性能。 文件详解 文件名称:Project-20200513T082053Z-003.zip 文件格式:ZIP...
-
Sheffield_Based_听觉处理与组织建模_语音和噪声混合数据集
数据集概述 本数据集包含用于《听觉处理与组织建模》研究的语音和噪声混合信号,源自谢菲尔德大学计算机科学系的博士论文。数据集以压缩包形式提供,核心内容为支持听觉处理建模研究的语音与噪声信号资源,总计包含一个文件。 文件详解 文件名称:cookePhD.zip 文件格式:ZIP...
-
Common_Voice_11_0_Spoken_NER_Dataset
数据集概述 本数据集是基于Common Voice 11.0构建的口语命名实体识别(Spoken NER)数据集,包含荷兰语、英语和德语三种语言的口语命名实体识别数据,共3个JSON格式文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集。 文件详解 荷兰语口语命名实体识别数据文件 文件名称:cv_nl_dataset.json...
-
DCASE2024_Task9_Based_语言查询音频源分离验证集数据
数据集概述 本数据集是DCASE 2024挑战赛Task 9(语言查询音频源分离)的验证集,包含1000个来自Freesound的音频文件及对应元数据,支持模型开发阶段的性能评估。音频已处理为10秒16kHz片段,每个文件配3条人工标注字幕,标签参考FSD50K规范,可用于生成无重叠类别的合成混合音频。 文件详解 lass_validation.zip...
-
UCL_Soundscape_Based_声音景观监测讲座完整数据_Dec
数据集概述 本数据集包含UCL于12月举办的声音景观监测讲座相关内容,以压缩文件形式呈现,未提供具体内容预览,核心主题围绕声音景观监测展开,可用于相关领域的学习与研究参考。 文件详解 文件名称:Soundscape Monitoring Lecture.zip 文件格式:ZIP(压缩文件)...
-
Lebedev_Based_50点正交阵列立体声与多通道脉冲响应测量数据集
数据集概述 本数据集包含50点Lebedev正交排列扬声器阵列的脉冲响应测量数据,覆盖多种立体声麦克风配置、32个Eigenmic胶囊及最高4阶Ambisonics格式,适用于立体声转Ambisonic上混算法的训练与研究,共包含2个文件。 文件详解 README.md 文件格式:Markdown...
-
Thorsten_Voice_Based_黑森方言语音数据集2023_09
数据集概述 本数据集为Thorsten-Voice项目的一部分,聚焦德语黑森方言(Hessisch),包含2108条语音短语。语音由Thorsten Müller录制,Dominik Kreutz优化音频,采用LJSpeech结构,采样率22.050Hz,单声道,归一化至-24dB,无首尾静音,以CC0协议开放授权。 文件详解...
-
OpenAIRlib_Based消声音频数据库2018年2月26日快照数据
数据集概述 本数据集是2018年2月26日从OpenAIRlib.net网站获取的“Anechoic Audio Database”的部分副本,以压缩包形式提供,便于学术用途下载。数据保留原始版权归属,文件类型单一,无目录结构或数据拆分。 文件详解 文件名称:anechoic_openAIRlib_ccsa.zip 文件格式:ZIP...



