找到4个数据集

标签: OCR模型

过滤结果
  • SurveySet_OCR与OMR问卷数字化数据集

    2025年12月20日 30 124 51

    数据集概述 该数据集为SurveySet,是基于真实客户体验问卷构建的数据集,用于支持统一OCR-OMR模型的开发与评估。包含手写数字、勾选标记、叉号、部分填充气泡等文本与视觉输入类型,反映实体问卷的多样性与结构变异性。 文件详解 文件名称: SurveySet.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 塞维利亚古版书字符分割与识别数据集1494_1500

    2025年12月11日 30 111 55

    数据集概述 该数据集包含针对1494-1500年塞维利亚古版书(INC/901)的字符分割与光学字符识别模型,基于Kraken工具训练,含62页、5556行数据,字体类型为97G,分割符合SegmOnto词汇标准。 文件详解 文件名称: inc_901_zenodo.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 欧盟车牌图像数据集

    2025年12月6日 30 173 57

    数据集概述 该数据集包含来自欧盟(主要为德国)的车辆车牌裁剪图像,涵盖德国多个州的车牌样本,可用于训练车牌检测、提取及OCR模型,支持贴纸检测与州分类模型开发。 文件详解 文件名称: eu-license-plates-0.0.1.zip 文件格式: .zip(压缩包) 内容说明:...
    packageimg
  • 希腊议会二战后会议记录分析与识别数据集1946_1947

    2025年12月5日 30 16 13

    数据集概述 该数据集通过文本识别与自然语言处理技术,解锁1946-1947年希腊议会会议记录的历史语料。包含经Transkribus训练的文本识别模型处理的3156张扫描图像,以及通过语言模型优化、信息提取技术分析的演讲数据,首次量化了获得掌声的议题。 文件详解 文件名称: README.md,文件格式: Markdown,内容:...
    packageimg