文档超分辨率任务专用精选文本聚焦DocLayNet子集

数据集概述

本数据集是基于DocLayNet数据集精选的子集,专注于文本类文档的超分辨率与恢复任务。数据包含高分辨率(HR)和低分辨率(LR)成对图像,按训练、验证、测试集划分,支持有监督学习研究。

文件详解

  • 文件名称:Dataset.zip
  • 文件格式:ZIP压缩包
  • 内容说明:压缩包内包含用于文档超分辨率任务的图像数据,按训练集(1000张)、验证集(200张)、测试集(200张)划分,每张图像均提供高分辨率(HR)真值与低分辨率(LR)配对数据,可用于模型训练与评估。

适用场景

  • 文档超分辨率模型训练:用于训练聚焦文本恢复的图像增强模型
  • 文档恢复效果评估:基于CER、PSNR等指标评估模型在文本可读性与感知质量上的表现
  • 文档图像处理研究:分析模型在不同训练阶段对文本恢复与整体感知质量的平衡能力
  • 光学字符识别(OCR)辅助研究:探索超分辨率技术对提升OCR准确率的作用机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 944.78 MiB
最后更新 2025年12月23日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。