找到3个数据集

标签: ALTO XML

过滤结果
  • 德累斯顿宫廷日记1673年手写文本识别基准数据集

    2025年12月19日 30 125 73

    数据集概述 本数据集包含1673年《德累斯顿选帝侯约翰·格奥尔格二世宫廷日记》的二十页手写文本基准数据,采用17世纪末萨克森典型楷书体书写,偶见混合字体。提供与原始图像对齐的转录文本及元数据,支持手写文本识别模型训练与评估。 文件详解 该数据集包含三类文件,具体说明如下: - 图像文件(20个): - 文件格式:JPG(.jpg) -...
    packageimg
  • 中古低地德语_Flos_unde_Blankeflos_数字外交版本与图像数据集

    2025年12月20日 30 97 85

    数据集概述 本数据集包含四部中古低地德语《Flos unde Blankeflos》手稿的数字外交版本与图像数据,采用Transkribus平台生成转录文本,提供ALTO XML、PAGE XML格式文件及数字图像、元数据,便于手稿文本与版式分析。 文件详解 手稿压缩文件(共4个):...
    packageimg
  • 德累斯顿宫廷日记手写文本识别真值数据集1653_1656

    2025年12月6日 30 48 14

    数据集概述 该数据集包含17世纪萨克森宫廷日记(1653-1656)的12页手写文本真值数据,采用典型的萨克森官方法式草书(Kanzleikurrent)书写,偶见混合字体。提供与原始图像对齐的转录文本及ALTO XML格式文件,适用于手写文本识别模型训练与验证。 文件详解 图像文件:...
    packageimg