-
Pracalit_OCR_Based梵语与纽瓦手稿OCR模型真值数据_持续更新
2026年1月20日 30 145 142
数据集概述 本数据集为Pracalit字体梵语与纽瓦手稿OCR模型的真值数据,包含PNG和XML文件,将持续更新。基于四份尼泊尔手稿的Pracalit Unicode转录文本创建,用于训练Transkribus平台的PyLaia模型,涵盖16至19世纪的梵语与纽瓦语手稿,支持古文字OCR模型的开发与优化。 文件详解...
-
希腊教父文献集OCR标注数据集2021_2022
2025年12月14日 30 142 23
数据集概述 该数据集是希腊教父文献集(Patrologia Graeca)的OCR标注基准数据,包含2021-2022年期间人工标注的100张文献图像及对应PageXML文件,覆盖文本区域检测(希腊文、拉丁文列、脚注、标题)和古多调希腊文识别(行级标注)两类任务,用于OCR模型训练与验证。 文件详解 核心文件:...



