数据集

音频MNIST时序频谱特征语音识别特征数据集

数据来源：互联网公开数据

标签：音频特征,语音识别,时序特征,频谱特征,机器学习,深度学习,分类任务

数据概述：本数据集包含了音频MNIST数据集中语音数字的时序和频谱特征，其中标签字段为0到9的数字，代表不同的语音数字。时序特征由0到99列构成，频谱特征由100到199列构成，所有特征均通过简单移动平均（SMA）方法提取。这些特征经过处理后，通过两个全连接层（512,512）进行机器学习模型训练，在80-20的训练测试数据分割下，模型达到了94%的分类准确率。值得注意的是，数字'4'在预测中表现最佳，具有较高的准确率。

数据用途概述：该数据集适用于语音识别、模式分类、特征提取与分析等任务。研究人员和开发者可以利用这些特征进行模型训练、特征工程优化，以及不同分类算法的对比研究。此外，该数据集还适用于教育和培训场景，帮助学习者理解特征工程在机器学习中的重要性，以及如何通过特征选择和处理提升模型性能。

数据与资源

音频MNIST时序频谱特征语音识别特征数据集.zipZIP
3.24 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	3.24 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。