漫画非约束文本检测数据集

数据集概述

该数据集为漫画非约束文本检测研究提供支持,包含四百五十张图像的文本分割数据,图像源自Manga109数据集(需单独申请访问)。数据分为预处理和后处理两个版本,文本标注采用黑色(易识别文本)和粉色(难检测文本)两种颜色区分。

文件详解

  • 文件名称:post-processed.zip
  • 文件格式:ZIP压缩包
  • 内容说明:后处理版本图像,已自动移除小连通组件、填充小孔洞,尺寸调整为8的倍数,包含黑色(易识别文本)和粉色(难检测文本)标注
  • 文件名称:pre-processed.zip
  • 文件格式:ZIP压缩包
  • 内容说明:预处理版本图像,为GIMP直接导出的原始处理文件,包含黑色(易识别文本)和粉色(难检测文本)标注

适用场景

  • 漫画文本检测算法训练与评估
  • 不同难度文本检测任务的性能对比研究
  • 图像处理技术(如连通组件分析、孔洞填充)在文本检测中的效果验证
  • 漫画文本语义分类(如对话框内/外文本、音效文本)的辅助研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 18.29 MiB
最后更新 2025年12月13日
创建于 2025年12月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。