按语音音系障碍分类的西班牙语音频数据集

数据集概述

该数据集包含秘鲁利马地区疑似语音音系障碍的学龄前儿童的西班牙语语音录音,按语音音系特征分类,用于深度学习模型的训练与验证。录音在临床及教育场景下由认证言语治疗师监督采集,存储为16kHz采样率、16位无压缩的WAV格式音频文件,共七百零一个文件。

文件详解

  • 目录结构:数据集包含多级目录,按语音类型(如africada、diptongos、fricativas、laterales)、具体音素(如ch、au、ei、f、s、l)、发音状态(如logrado、omision、sustitución、distorsion)分类存储音频文件。
  • 音频文件:所有文件为WAV格式(.wav),示例文件如Spanish audios classified according to phonetic-ph/Audios/africada/ch/logrado/ch_logrado_Chancho_Chancho_inicial_10-37-13_augmented_0.wav,命名包含音素、发音状态、单词、音素位置等信息。

适用场景

  • 语音障碍辅助诊断模型开发:用于训练识别西班牙语语音音系障碍的深度学习模型。
  • 语音治疗研究:分析不同类型语音障碍的声学特征及干预效果。
  • 语言学研究:探究学龄前儿童西班牙语语音发展规律及障碍模式。
  • 临床工具优化:为言语治疗师提供标准化的语音障碍音频样本库。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 39.99 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。