-
Swinemünder_Badeanzeiger_历史报纸表格OCR人工标注数据集
2026年1月18日 30 129 44
数据集概述 本数据集为历史报纸《Swinemünder Badeanzeiger》表格信息提取的人工标注真值数据,按年份组织文件夹,每个年份文件夹含原始图像ID命名的子文件夹,包含分割表格图像、人工转录的结构化JSON标注及条目与表格行关联的索引JSON,另有汇总所有条目的JSON文件,用于OCR信息提取模型训练与评估。 文件详解...
-
数据19世纪奥地利报纸OCR训练数据集_NewsEye_READ
2025年12月4日 30 16 14
数据集概述 该数据集包含19世纪至20世纪初奥地利报纸页面的经人工校正文本数据,分为训练集(148页)和验证集(13页),采用PAGE格式存储,由Transkribus平台生成,支持NewsEye与READ项目研究。 文件详解 训练集文件:...



