阿拉伯数字语音与图像数据集

阿拉伯数字语音与图像数据集 数据来源:互联网公开数据
标签:语音识别,图像分类,阿拉伯数字,深度学习,数据挖掘,SqueezeNet,Inception v3,时间序列分析,特征提取

数据概述:
本数据集包含以下内容:
1. 平衡的阿拉伯数字语音数据集,涵盖从十(عشرة)到零(صفر)的语音wav文件,存储于"Dataset"文件夹中。
2. 平衡的阿拉伯数字图像数据集,包含从十到零的png格式图像,同样存储于"Dataset"文件夹中。
3. 通过深度学习方法(SqueezeNet和Inception v3)从语音文件的频谱图中生成的表格数据。
4. 使用Orange Data Mining工具(版本3.36)生成的工作流程文件(".ows"格式),用于数据处理和分析。

数据用途概述:
该数据集适用于多种场景,包括但不限于:
1. 语音识别模型的训练与优化,特别是针对阿拉伯数字的语音识别任务。
2. 图像分类模型的开发与评估,尤其是针对阿拉伯数字的图像识别任务。
3. 声学特征和视觉特征的提取与研究,支持跨模态数据的分析与应用。
4. 机器学习模型的构建与测试,尤其是基于SqueezeNet和Inception v3的分类任务。
5. 教育与研究用途,如语音处理、图像处理和跨模态数据融合的实验与教学。

研究者在使用该数据集时,建议参考以下论文进行学术引用:https://jesaun.journals.ekb.eg/article_322153.html

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 223.31 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。