埃及儿童阿拉伯语发音错误检测数据集-abdelrhmansalah22

埃及儿童阿拉伯语发音错误检测数据集-abdelrhmansalah22

数据来源:互联网公开数据

标签:阿拉伯语,发音错误,语音识别,儿童,教育,对话,数据集,误发音

数据概述: 本数据集包含埃及100名2至8岁儿童在对话中阿拉伯语发音错误的录音。数据集包括100个常用阿拉伯语单词的录音,由100名儿童发音。部分儿童发音了100个单词,而其他儿童则发音了50个单词。数据集被组织成100个文件夹,每个文件夹包含100或50个发音单词的文件。录音使用Audacity软件工具进行录制,音频文件为单声道,采样率为44.1 kHz,分辨率为32位。录音过程中可能存在的环境噪音通过Audacity软件进行了去除。每个发音单词文件都被标注为正确或错误发音,并标注了从0到99的ID,对应发音的单词。该数据集的建立旨在解决阿拉伯语发音错误检测系统训练数据不足的问题。

数据用途概述: 该数据集适用于阿拉伯语语音识别研究、发音错误检测系统开发、儿童语言教育和评估等场景。研究人员可以利用此数据集进行阿拉伯语发音错误的识别研究;教育工作者可以利用此数据集评估和改进儿童的阿拉伯语发音;开发者可以利用此数据集训练和优化阿拉伯语发音错误检测模型。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 362.47 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。