乌尔都语印刷文本图像识别扩展数据集-MMU-Extension-22-tayyabnasir22

乌尔都语印刷文本图像识别扩展数据集-MMU-Extension-22-tayyabnasir22 数据来源:互联网公开数据 标签:乌尔都语,OCR,文本识别,印刷文本,深度学习,机器学习,图像,文本,语言学,计算机视觉 数据概述: 本数据集是MMU-OCR-21数据集的扩展,旨在为印刷乌尔都语光学字符识别(OCR)任务提供一个公开可用的数据集。MMU-Extension-22数据集增加了字体多样性,提供了更多样的示例,旨在增强机器学习和深度学习模型的泛化能力。该数据集是研究工作“高效CRNN:利用深度可分离卷积和门控循环单元实现端到端低资源乌尔都语文本识别”的一部分。数据集的生成细节可参考相关论文。 数据用途概述: 该数据集适用于训练和评估乌尔都语OCR模型,包括但不限于深度学习模型。研究人员可以使用该数据集进行算法开发、模型优化和性能比较,推动乌尔都语文本识别技术的发展。该数据集也适用于教育和学术研究,为相关领域的学习和研究提供了重要的资源。此外,该数据集可以促进乌尔都语文化遗产的数字化和保护。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 229.73 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。