-
基于Lee_蔡家语音特征_的CLDF数据集2023
数据集概述 该数据集为CLDF格式,源自Lee于2023年发表的《从历时视角看蔡家语的显著语音特征》一文,核心围绕蔡家语语音特征的历时语言学分析,以压缩包形式存储,为相关语言研究提供结构化数据支持。 文件详解 文件名称:lexibank/leecaijia-v1.3.zip 文件格式:ZIP(.zip)...
-
数据3D麦克风阵列主观评价数据集
数据集概述 本数据集包含使用多种3D麦克风阵列录制的音频文件及其主观评价数据。通过收集听众对不同麦克风阵列录制音频的定位、环绕感、音色和整体质量等维度的评分,为3D音频录制技术的效果评估提供数据支持。 文件详解 音频文件(MP3格式,共7个): 包含不同3D麦克风阵列录制的音频样本,如Zemlinsky Takt 1-71,...
-
代特莫尔德音乐学院空间房间脉冲响应开放数据库
数据集概述 该数据集是代特莫尔德音乐学院三个不同表演空间的空间房间脉冲响应(SRIR)开放数据库,包含约600个多通道RIR,涵盖不同声源和接收器配置,部分含人工混响等特殊条件。 文件详解 文件名称:DetmoldSRIR_v01.zip 文件格式:ZIP(.zip) 内容说明:数据集压缩包,包含三个房间的SRIR测量数据,按Set...
-
教室环境音频与三维模型数据集
数据集概述 该数据集包含荷兰小学教室的环境音频(含儿童嘈杂声、房间脉冲响应)及教室三维模型,音频采用Ambisonics格式存储,模型提供Blender和OBJ文件,为虚拟教室环境构建提供多模态数据支持。 文件详解 文档文件: Classroom Environment Description Document...
-
PodcastMix播客音乐与语音分离数据集
数据集概述 该数据集用于播客中的背景音乐与前景语音分离任务,包含44.1kHz音频文件及对应元数据。因Zenodo限制,此处仅提供元数据,完整数据集需从指定Google Drive链接获取,为音频分离算法研究提供支持。 文件详解 核心文件: podcastmix.zip: ZIP压缩格式,包含Zenodo上托管的元数据文件 说明:...
-
键盘声音数据集
数据集概述 本数据集为音频波形分类任务设计,包含薄膜、缩放仪、机械蓝轴、机械红轴等不同类型键盘的按键声音数据,适合深度学习初学者使用。 文件详解 文件名称: keyboard_sound_dataset.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含总计415个WAV格式音频文件,其中训练集315个,评估集100个。音频参数统一为44.1...
-
METU_SPARG_Eigenmike_em32声学脉冲响应数据集2018
数据集概述 该数据集包含2018年1月23日在METU信息研究生院S05教室采集的声学脉冲响应(AIR)数据,使用Eigenmike em32和Alctron M6麦克风,覆盖240个测量点,采样率48kHz,以16位WAV格式存储。 文件详解 压缩文件: spargair.zip:...
-
基于情感类别和性别的可解释语音情感识别特征附录
数据集概述 本数据集为论文《基于情感类别和性别的可解释语音情感识别特征》的附录表格文件,包含通过SHAP值分析得到的特征信息量数据,涉及情感与中性语音、不同性别间的统计检验结果及模型最具信息量特征等内容。 文件详解 文件名称: zenodo_tables.pdf 文件格式: PDF (.pdf) 文件内容: 包含多组附录表格,具体如下: 表VIII-...
-
THCHS_30_国际音标对齐转录数据集
数据集概述 该数据集为OpenSLR平台THCHS-30数据集提供国际音标(IPA)对齐转录,包含标点添加、静音标记及音素时长标记,标注文件首尾静音,支持语音处理相关研究。 文件详解 压缩文件: grids.zip:...
-
I_BiDaaS_TID_合成呼叫中心数据集
数据集概述 本数据集为模拟呼叫中心交互数据,基于真实电话交互与典型呼叫中心对话场景构建,由演员模拟客户与坐席角色,通过不同移动及固定电话设备录制。包含原始音频波形、自动语音识别转录文本及词段时间戳、置信度得分等信息。 文件详解 01_Synthetic CallCentresTID_I-...
-
语音转换挑战2020数据库v1_0
数据集概述 本数据集为2020年语音转换挑战(VCC 2020)的官方数据库,包含单语种半平行与跨语种语音转换任务的训练、评估数据,以及英文目标说话人参考语音和评估数据转录文本,用于推动语音转换技术的标准化研究与评测。 文件详解 文件名称: nii-yamagishilab/VCC2020-database-v1.0.0.zip 文件格式:...
-
AITAM学院教师语音数据集
数据集概述 本数据集收集了印度AITAM学院Tekkali校区150名教师的语音数据,以压缩文件形式存储,为语音相关研究提供基础数据支持。 文件详解 文件名称: VOICE_DATA.rar 文件格式: RAR压缩包 (.rar) 内容说明: 压缩包内包含150名AITAM学院教师的语音数据,未提供具体文件结构或字段信息 数据来源 AITAM...
-
孟加拉语孤立语音数据集
数据集概述 该数据集包含孟加拉语孤立语音样本,涵盖34个孟加拉语单词和24个英语单词,由25名来自孟加拉国不同地区的人员录制,每个单词30个样本,总计1800个样本,用于语音识别相关研究。 文件详解 该数据集由两个压缩文件组成,具体说明如下: - 文件名称: Bangla Isolated Speech...
-
语音练习音频数据集
数据集概述 该数据集是定制构建的音频语料库,包含阿拉伯字母“أ”至“ت”的正确与错误发音音频样本,共一百九十八个,以标准化格式记录,用于支持语音学习和发音纠正相关的模型训练与特征提取。 文件详解 文件名称: Phonics Exercise Audio Dataset.zip 文件格式: ZIP (.zip) 内容说明:...
-
泰米尔语正常人群语音数据库
数据集概述 该数据集为泰米尔语正常人群语音数据库,收录15至46岁泰米尔语母语者的语音数据,包含孤立数字、连接词及连续句子,采样率16kHz、16位单声道PCM格式,可用于语音识别等研究。 文件详解 文件名称: Speech database-Normal persons-Tamil.rar 文件格式: RAR(压缩包格式) 内容说明:...
-
孟加拉地区语音数据集_RBVD
数据集概述 本数据集通过面对面录音采集了孟加拉国八个地区的语音样本,包含不同地区的孟加拉语发音变体。每个地区对应一个文件夹,朗布尔地区分男女两个子文件夹,共1067个样本,支持孟加拉语方言多样性研究与语音技术开发。 文件详解 核心压缩文件: RBVD Regional Bangla Voice Dataset.zip(ZIP格式) 内部结构:...
-
神经语音夹带对语音可懂度的调节数据集
数据集概述 该数据集包含神经语音夹带与语音可懂度调节研究相关的单被试数据及刺激生成代码,支持对语音实验中神经反应与可懂度关系的分析。 文件详解 Riecke et al Figure 2.zip: ZIP格式压缩文件,包含支撑图2A和2C组数据的单被试数据,内部文件为Matlab(MAT)格式。 Riecke et al Figure 4.zip:...
-
孟加拉语语音八类情感识别音频数据集
数据集概述 该数据集包含三千二百二十个WAV格式的孟加拉语语音音频文件,覆盖愤怒、开心、悲伤、中性、惊讶、恐惧、失望、兴奋八类情感。音频时长统一为五秒,采集自YouTube的真实场景,包含男女不同性别声音,为孟加拉语语音情感识别研究提供多样化数据支持。 文件详解 音频文件目录结构:按情感类别和性别分层存储,例如 BanglaMood A Rich...
-
MAVES_DB_马拉雅拉姆语视听情感语音数据集
数据集概述 本数据集聚焦马拉雅拉姆语视听情感语音,包含相关研究使用协议文件,适用于语音识别、情感识别等研究场景,为相关技术开发与分析提供协议支持。 文件详解 文件名称: Data Usage Agreement for research.docx 文件格式: DOCX(Word文档) 内容说明: 该文件为研究数据使用协议,未提供具体字段信息 适用场景...
-
真实与扬声器虚拟声环境下语音清晰度测量与建模数据集
数据集概述 本数据集包含与"Measuring and modeling speech intelligibility in real and loudspeaker-based virtual sound environments"出版物相关的语音清晰度数据,支持研究真实与扬声器虚拟声环境下语音清晰度的测量与建模分析。 文件详解 文件名称:...



