找到2个数据集

标签: 古文字OCR

过滤结果
  • Pracalit_OCR_Based梵语与纽瓦手稿OCR模型真值数据_持续更新

    2026年1月20日 30 145 142

    数据集概述 本数据集为Pracalit字体梵语与纽瓦手稿OCR模型的真值数据,包含PNG和XML文件,将持续更新。基于四份尼泊尔手稿的Pracalit Unicode转录文本创建,用于训练Transkribus平台的PyLaia模型,涵盖16至19世纪的梵语与纽瓦语手稿,支持古文字OCR模型的开发与优化。 文件详解...
    packageimg
  • 希腊教父文献集OCR标注数据集2021_2022

    2025年12月14日 30 142 23

    数据集概述 该数据集是希腊教父文献集(Patrologia Graeca)的OCR标注基准数据,包含2021-2022年期间人工标注的100张文献图像及对应PageXML文件,覆盖文本区域检测(希腊文、拉丁文列、脚注、标题)和古多调希腊文识别(行级标注)两类任务,用于OCR模型训练与验证。 文件详解 核心文件:...
    packageimg