找到2个数据集

标签: 历史报纸OCR

过滤结果
  • Swinemünder_Badeanzeiger_历史报纸表格OCR人工标注数据集

    2026年1月18日 30 129 44

    数据集概述 本数据集为历史报纸《Swinemünder Badeanzeiger》表格信息提取的人工标注真值数据,按年份组织文件夹,每个年份文件夹含原始图像ID命名的子文件夹,包含分割表格图像、人工转录的结构化JSON标注及条目与表格行关联的索引JSON,另有汇总所有条目的JSON文件,用于OCR信息提取模型训练与评估。 文件详解...
    packageimg
  • 数据19世纪奥地利报纸OCR训练数据集_NewsEye_READ

    2025年12月4日 30 16 14

    数据集概述 该数据集包含19世纪至20世纪初奥地利报纸页面的经人工校正文本数据,分为训练集(148页)和验证集(13页),采用PAGE格式存储,由Transkribus平台生成,支持NewsEye与READ项目研究。 文件详解 训练集文件:...
    packageimg