-
中古低地德语_Flos_unde_Blankeflos_数字外交版本与图像数据集
2025年12月20日 30 102 54
数据集概述 本数据集包含四部中古低地德语《Flos unde Blankeflos》手稿的数字外交版本与图像数据,采用Transkribus平台生成转录文本,提供ALTO XML、PAGE XML格式文件及数字图像、元数据,便于手稿文本与版式分析。 文件详解 手稿压缩文件(共4个):...
-
基督教阿拉伯文手写文本识别模型训练数据集
2025年12月10日 30 141 98
数据集概述 本数据集包含基督教阿拉伯文手稿的图像及专家校正的分割、转录数据,以PAGE XML格式存储,用于训练和测试Agapet手写文本识别模型,兼容Transkribus、eScriptorium/Kraken等工具。 文件详解 文件名称: Sin423 (17th cent).zip:ZIP格式压缩包,包含17世纪Sinai Arabic...
-
巴黎圣母院教务会议登记册数字化协作项目中世纪手稿手写文本识别基准数据集1326_1504
2025年12月5日 30 169 119
数据集概述 本数据集为e-NDP项目产出的中世纪手稿手写文本识别(HTR)基准数据,包含1326-1504年巴黎圣母院教务会议登记册的512页标注内容,涵盖文本转录与版面分割信息,支持中世纪草书手写文本识别模型训练与评估。 文件详解 主压缩文件: e-NDP_dataset.zip: ZIP格式压缩包,包含数据集所有内容...



