数据集

阿拉伯数字语音与图像数据集

阿拉伯数字语音与图像数据集数据来源：互联网公开数据
标签：语音识别,图像分类,阿拉伯数字,深度学习,数据挖掘,SqueezeNet,Inception v3,时间序列分析,特征提取

数据概述：
本数据集包含以下内容：
1. 平衡的阿拉伯数字语音数据集，涵盖从十（عشرة）到零（صفر）的语音wav文件，存储于"Dataset"文件夹中。
2. 平衡的阿拉伯数字图像数据集，包含从十到零的png格式图像，同样存储于"Dataset"文件夹中。
3. 通过深度学习方法（SqueezeNet和Inception v3）从语音文件的频谱图中生成的表格数据。
4. 使用Orange Data Mining工具（版本3.36）生成的工作流程文件（".ows"格式），用于数据处理和分析。

数据用途概述：
该数据集适用于多种场景，包括但不限于：
1. 语音识别模型的训练与优化，特别是针对阿拉伯数字的语音识别任务。
2. 图像分类模型的开发与评估，尤其是针对阿拉伯数字的图像识别任务。
3. 声学特征和视觉特征的提取与研究，支持跨模态数据的分析与应用。
4. 机器学习模型的构建与测试，尤其是基于SqueezeNet和Inception v3的分类任务。
5. 教育与研究用途，如语音处理、图像处理和跨模态数据融合的实验与教学。

研究者在使用该数据集时，建议参考以下论文进行学术引用：https://jesaun.journals.ekb.eg/article_322153.html

数据与资源

阿拉伯数字语音与图像数据集.zipZIP
223.31 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	223.31 MiB
最后更新	2025年6月1日
创建于	2025年6月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

阿拉伯数字语音与图像数据集

数据与资源

附加信息

注册成功！