找到4个数据集

标签: HTR

过滤结果
  • 德累斯顿宫廷日记1673年手写文本识别基准数据集

    2025年12月19日 30 187 144

    数据集概述 本数据集包含1673年《德累斯顿选帝侯约翰·格奥尔格二世宫廷日记》的二十页手写文本基准数据,采用17世纪末萨克森典型楷书体书写,偶见混合字体。提供与原始图像对齐的转录文本及元数据,支持手写文本识别模型训练与评估。 文件详解 该数据集包含三类文件,具体说明如下: - 图像文件(20个): - 文件格式:JPG(.jpg) -...
    packageimg
  • 中世纪希伯来手稿手写文本识别标注数据集

    2025年12月14日 30 87 73

    数据集概述 该数据集为手写文本识别(HTR)研究提供标注数据,包含法国国家图书馆(BnF)和梵蒂冈图书馆(BAV)的202张中世纪希伯来手稿图像的布局分割(区域、顶线、行多边形)及Unicode转录(ALTO 4.2 XML格式),支持中世纪希伯来手稿的文本识别模型训练与研究。 文件详解 BiblIA_dataset.zip:...
    packageimg
  • 捷克波西米亚历史文献转录超级模型数据集2024

    2025年12月14日 30 81 54

    数据集概述 该数据集记录了2024年学生资助竞赛(SGS)项目中,学生团队基于Transkribus平台开发的捷克历史文献转录模型成果。包含训练集、验证集的错误率数据,多个学生开发的转录模型(如Finale 2.0、Agreg-8)及其字符错误率(CER),以及最终聚合模型CZECH...
    packageimg
  • 巴黎圣母院教务会议登记册数字化协作项目中世纪手稿手写文本识别基准数据集1326_1504

    2025年12月5日 30 123 18

    数据集概述 本数据集为e-NDP项目产出的中世纪手稿手写文本识别(HTR)基准数据,包含1326-1504年巴黎圣母院教务会议登记册的512页标注内容,涵盖文本转录与版面分割信息,支持中世纪草书手写文本识别模型训练与评估。 文件详解 主压缩文件: e-NDP_dataset.zip: ZIP格式压缩包,包含数据集所有内容...
    packageimg