皮肤图像诊断分析数据集-ISIC2020256x256-ziadloo
数据来源:互联网公开数据
标签:皮肤病,图像分析,医学影像,ISIC,皮肤癌,深度学习,图像数据集,HDF5,诊断,256x256
数据概述:
本数据集基于ISIC(International Skin Imaging Collaboration)公开数据集构建,主要用于皮肤病图像分析和诊断研究。 数据集包含经过预处理的皮肤病变图像,所有图像均已被调整为256x256像素的尺寸。 此外,数据集新增了“target”列,用于指示图像对应的病变类型,该列的值为0、1或null,用于表示良性、恶性和未知。
“target”列的生成规则如下:
如果“benign_malignant”列明确标识为“benign”或“malignant”,则“target”列分别设为0和1。
如果“benign_malignant”列为空,则根据“diagnosis”列的值来确定“target”列的值。 如果“diagnosis”列的值为以下任一情况,则“target”设为1(恶性):
鳞状细胞癌
基底细胞癌
黑色素瘤
如果“benign_malignant”列为空且“diagnosis”列的值为“vascular lesion”,则“target”设为null(未知)。
数据预处理:
图像尺寸调整:所有图像均使用Python代码进行缩放,以确保统一的256x256像素尺寸。 缩放过程保持图像原始长宽比,并在必要时添加黑色边框以适应目标尺寸。
数据集组织:数据集以HDF5文件格式存储,方便高效的数据读取和处理。
数据用途概述:
该数据集适用于皮肤病图像分析、机器学习模型训练、皮肤癌诊断辅助、医学影像研究等多种场景。 研究人员可以使用此数据集进行图像分类、目标检测、病变分割等任务,以开发用于皮肤病诊断的AI模型。 此外,数据集也适用于教育和培训,帮助学习者理解皮肤病图像分析的基本原理和方法。