RAVI_乌尔都语合成文本图像OCR数据集

数据集概述

该数据集是用于乌尔都语光学字符识别(OCR)模型开发与训练的合成图像数据集,包含九万九千张带标注的256×256像素图像,每张图像含单个乌尔都语单词,采用Jameel Noori Nastaleeq字体,按乌尔都字母分类存储,支持OCR系统的训练、验证与基准测试。

文件详解

  • 文件名称:RAVI_dataset.zip
  • 文件格式:ZIP压缩包
  • 内容说明:压缩包内包含九万九千张256×256像素的乌尔都语单词图像,每张图像对应乌尔都语单词标注;图像按乌尔都字母分类存储于子文件夹中,文本字体为Jameel Noori Nastaleeq(40号字),背景为白色,文字为黑色

适用场景

  • 乌尔都语OCR模型开发:用于训练基于CNN的印刷体乌尔都语单词识别模型
  • 低资源语言深度学习研究:作为基准数据集验证序列预测架构在乌尔都语文本识别中的性能
  • 字符级OCR性能评估:通过字母分类子文件夹分析模型对特定乌尔都字符的识别准确率
  • 计算机视觉与自然语言处理交叉研究:支持图像文本检测与识别的多模态模型训练
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 192.48 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。