日语元音-ae-发音LPC系数时间序列数据集-语音识别研究-9位男性发音者-实验数据
数据来源:互联网公开数据
标签:语音识别,日语,元音,LPC系数,时间序列,语音学,机器学习,声音,语音特征,声学
数据概述:
本数据集包含9位男性发音者连续发出日语元音/ae/时的声音数据,并提取了其线性预测编码(LPC, Linear Predictive Coding)倒谱系数。数据共包含640条时间序列,每条时间序列代表一次发音,序列长度在7到29之间,每个时间点有12个特征,即12个LPC倒谱系数。数据被分为训练集(270条时间序列)和测试集(370条时间序列)。
数据采集参数:
采样率:10kHz
帧长:25.6 ms
帧移:6.4ms
LPC系数阶数:12
数据组织方式:每行代表一个分析帧的12个LPC系数,系数按递增顺序排列,以空格分隔。一组7-29行构成一个block,代表一次/ae/发音。每个发音者由一组连续的blocks组成。
训练集(ae.train):每个发音者有30个blocks。blocks 1-30代表发音者1,blocks 31-60代表发音者2,依此类推至发音者9。
测试集(ae.test):发音者1有31个blocks,发音者2有35个blocks,发音者3有88个blocks,以此类推。
数据用途概述:
该数据集主要用于语音识别、语音合成、语音特征提取等研究。研究人员可以使用此数据训练和评估语音识别模型,探索不同语音特征对识别准确率的影响;可以用于构建日语元音的声学模型;也可以用于研究发音者之间的语音差异。此外,该数据集也适合用于机器学习和模式识别的教学,帮助学习者理解时间序列数据的处理和分析。