RANZCR胸部X光影像多标签分类数据集-Kaggle竞赛-128x128分辨率-prateek0x
数据来源:互联网公开数据
标签:医学影像,X光,胸部,多标签分类,TFRecords,图像数据,Kaggle竞赛,计算机视觉,医疗诊断
数据概述:
本数据集是为Kaggle RANZCR-CLiP竞赛准备的TFRecords格式的胸部X光影像数据,图像分辨率为128x128像素,采用JPEG格式,并经过cv2.resize()处理。数据集包含多标签信息,使用Group KFold分层抽样方法进行数据划分。
数据集中每个样本都包含以下特征:
image:图像数据,以字节串形式存储
ETT - Abnormal:气管插管(ETT)异常情况的标签(整数)
ETT - Borderline:气管插管(ETT)临界情况的标签(整数)
ETT - Normal:气管插管(ETT)正常情况的标签(整数)
NGT - Abnormal:鼻胃管(NGT)异常情况的标签(整数)
NGT - Borderline:鼻胃管(NGT)临界情况的标签(整数)
NGT - Incompletely Imaged:鼻胃管(NGT)未完全成像的标签(整数)
NGT - Normal:鼻胃管(NGT)正常情况的标签(整数)
CVC - Abnormal:中心静脉导管(CVC)异常情况的标签(整数)
CVC - Borderline:中心静脉导管(CVC)临界情况的标签(整数)
CVC - Normal:中心静脉导管(CVC)正常情况的标签(整数)
Swan Ganz Catheter Present:Swan Ganz导管存在的标签(整数)
StudyInstanceUID:研究实例唯一标识符,以字节串形式存储
PatientID:患者ID,以字节串形式存储
数据用途概述:
该数据集主要用于医学影像分析、计算机视觉模型训练,特别是针对胸部X光影像的多标签分类任务。研究人员可以利用此数据开发和评估用于辅助诊断的机器学习模型,例如识别气管插管、鼻胃管、中心静脉导管等医疗设备的状态,以及其他相关的胸部异常情况。此外,该数据集也适用于深度学习研究,例如图像识别、目标检测等领域。