数据集概述
本数据集是ICDAR2003非正式在线单词识别竞赛的基准集,包含来自不同平板设备、国籍和语言的孤立在线自由手写(手写体、混合体、草书)单词数据,支持ASCII字符集标签,可用于评估“即学即用”识别性能。
文件详解
- 文件名称: _README.txt
- 文件格式: TXT
- 内容: 数据集基本说明,包括数据规模(一万三千一百一十九个单词、八百八十四个唯一词汇、七十二名书写者)、语言(荷兰语、英语、意大利语)、国籍及使用说明。
- 文件名称: Copyright.txt
- 文件格式: TXT
- 内容: 版权声明文档,标注版权归属国际Unipen基金会(2003年)。
- 文件名称: unipen-ICROW-2003.tgz
- 文件格式: TGZ
- 内容: 压缩包文件,包含竞赛测试文件,如NIC-Pc95*.dat等UNIPEN格式的手写单词数据文件。
- 文件名称: ICROW-2003-rev.pdf
- 文件格式: PDF
- 内容: 可能为竞赛修订说明文档。
- 文件名称: ICROW-2003-rev.odp
- 文件格式: ODP
- 内容: 可能为竞赛修订演示文稿。
数据来源
International Unipen Foundation
适用场景
- 在线手写单词识别算法性能测试与评估
- 多语言(荷兰语、英语、意大利语)手写识别模型训练
- 不同手写风格(手写体、混合体、草书)识别研究
- 跨设备、跨国籍手写数据的模式分析