PharmAI片剂名称综合图像数据集

数据集概述

该数据集是一个包含片剂名称图像的综合集合,适用于OCR、图像分类和药物识别等应用。数据集按字母顺序分为26个文件夹,每个文件夹包含100张原始图像,并提供超过一万张增强图像,以丰富机器学习模型的训练数据。

文件详解

  • 主目录: PharmAIA Comprehensive Image Dataset of Tablet Nam/,包含按字母顺序排列的子文件夹和增强图像子文件夹
  • 原始图像文件夹: 按字母A-Z命名的26个文件夹(如a/、b/),每个文件夹包含100张原始片剂名称图像,文件格式主要为.jpg、.png、.jpeg,示例文件如a13.jpg、b12.jpg
  • 增强图像文件夹: augmented/目录下包含对应字母的子文件夹(如augmented/a/),存储通过图像增强技术生成的额外图像,提升数据集多样性
  • 文件格式分布: .jpg格式占比约百分之九十三点八一,.png约百分之六点零二,.jpeg约百分之零点一八

适用场景

  • 光学字符识别(OCR)模型训练: 用于识别图像中的片剂名称文本
  • 图像分类任务: 基于片剂名称图像进行分类模型开发
  • 药物识别系统构建: 辅助开发自动识别药品名称的视觉系统
  • 机器学习模型鲁棒性测试: 利用增强图像提升模型对不同图像变体的适应能力
  • 医疗AI应用研究: 支持医疗领域中与药品视觉识别相关的人工智能研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 369.82 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。