RIMES_Based_ICDAR_2011法语手写识别竞赛行片段数据集_2024公开版

数据集概述

本数据集为2011年ICDAR法语手写识别竞赛第二任务的行片段数据,是RIMES数据库的子集。包含12111行手写文本图像及12107条转录文本,覆盖超87k个单词实例,按标准划分训练、验证和测试集,用于支持手写文本识别研究。

文件详解

  • 文件名称:RIMES-2011-Lines.zip
  • 文件格式:ZIP(压缩包)
  • 内容说明:包含竞赛第二任务所需的行片段数据,分为训练集(10188张图像)、验证集(1138张图像)和测试集(778张图像);图像为灰度JPEG格式,转录文本为UTF-8编码的单独文件。

数据来源

RIMES数据库(原始由DGA/CTA/DT/GIP - CEP Arcueil、TSP – ARTEMIS Télécom SudParis、A2iA SA联合收集,2024年由Mitek Systems, Inc公开)

适用场景

  • 手写文本识别模型训练:用于开发和优化法语手写行文本的识别算法。
  • 模型性能评估:通过标准的训练/验证/测试划分,客观评估手写识别系统的准确率。
  • 语言处理研究:分析法语手写文本的特征,支持手写语言模型的改进。
  • 竞赛基准测试:作为ICDAR 2011竞赛任务的复现与扩展研究的基准数据集。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 364.75 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。