-
基于柏林国家图书馆历史报纸的OCR_OLR系统训练与评估真实数据集
2026年1月27日 30 45 40
数据集概述 本数据集包含柏林国家图书馆50页数字化历史报纸的真值数据,用于OCR/OLR系统的训练与评估,由欧盟ICT-PSP项目Europeana Newspapers产出。数据集含PAGE-XML格式真值文件、全分辨率及二值化扫描图像、对应OCR结果等5个压缩包,为历史报纸文本识别技术提供标准化测试资源。 文件详解 gt_page.zip...
2026年1月27日 30 45 40