PB2007_Based_法语声学_发音同步语音数据集

数据集概述

本数据集为PB2007法语声学-发音语音数据库,包含法语语音的声学信号与电磁发音仪(EMA)记录的发音运动数据,同步采集自法语受试者,支持语音生产机制研究与声学-发音转换模型开发。

文件详解

  • _seq/目录
  • 内容:电磁发音仪(EMA)数据,采样频率100Hz
  • 传感器对应字段:PAR01(下切牙x坐标)、PAR02(舌尖x坐标)、PAR03(舌背x坐标)、PAR04(舌后x坐标)、PAR05(下唇x坐标)、PAR06(上唇x坐标)、PAR07(下切牙z坐标)、PAR08(舌尖z坐标)、PAR09(舌背z坐标)、PAR10(舌后z坐标)、PAR11(下唇z坐标)、PAR12(上唇z坐标)
  • _wav16/目录
  • 内容:受试者音频信号,与EMA数据同步
  • 格式:PCA wav,16kHz采样率,16位精度
  • _lab/目录
  • 内容:语音的音素分割标注
  • 标注集:包含长短停顿、法语元音(如a、e^、i等)、辅音(如p、t、k等)共40余种符号

数据来源

Univ. Grenoble Alpes, CNRS, Grenoble INP, GIPSA-lab

适用场景

  • 语音生产机制研究:分析法语发音时舌、唇、牙齿等器官的运动轨迹与声学信号的对应关系
  • 声学-发音转换模型开发:基于同步数据训练从声学特征反推发音运动的统计模型
  • 法语语音学研究:探索法语元音、辅音的发音生理特征与声学表现
  • 语音合成与识别优化:为法语语音合成系统提供发音运动约束,提升自然度;或辅助语音识别的音素边界定位
  • 言语障碍评估:作为正常法语发音的基准数据,支持言语障碍患者的发音运动异常分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 36.05 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。