RANZCR胸部X光疾病诊断模型性能评估数据集-khoongweihao
数据来源:互联网公开数据
标签:医学影像,X光,深度学习,模型评估,疾病诊断,RANZCR,AUC,模型融合
数据概述:
本数据集详细记录了13个基于深度学习的RANZCR(澳大利亚和新西兰放射科医师学会)胸部X光疾病诊断模型的性能表现。数据集的核心内容是每个模型的OOF(Out-of-Fold,交叉验证预测结果)和Subs(提交结果)的详细信息,以及它们在RANZCR竞赛中公共排行榜上的得分(LB,Leaderboard)。这些模型都旨在从胸部X光图像中诊断出各种疾病。
数据包括以下模型:
- multihead inception v3 + swish + x768 (LB: 0.959)
- multihead resnet200d_320 + swish + x640 (LB: 0.967)
- multihead seresnet152d + swish + x768 (LB: 0.966)
- resnet200d + x512 (LB: 0.965)
- multihead seresnet152d + x512 best auc (LB: 0.965)
- multihead seresnet152d + x768 best loss (LB: 0.965)
- multihead resnet200d_320 + x640 best auc (LB: 0.966)
- multihead resnet200d_320 + mish + x640 best auc (LB: 0.966)
- multihead ecaresnet101d + x640 best model (LB: UNKNOWN)
- multihead regnety_032 + x640 best model (LB: UNKNOWN)
- multihead resnet200d_320 + gelu + x640 best auc (LB: 0.965)
- NFNet-F5 + x512 (LB: 0.902)
- multihead deep resnet200d_320 + swish + x640 best auc (LB: UNKNOWN)
每个模型都使用了不同的网络结构、激活函数、输入图像尺寸等配置。LB分数代表了模型在公共排行榜上的表现,AUC(Area Under Curve,曲线下面积)是衡量模型分类性能的指标。
数据用途概述:
该数据集主要用于深度学习模型的研究与开发,尤其是在医学影像诊断领域。研究人员可以利用此数据:
- 比较不同模型架构和训练策略对模型性能的影响。
- 进行模型融合,通过组合多个模型的预测结果来提高整体性能。
- 分析模型的优缺点,为进一步改进模型提供指导。
- 评估不同模型的泛化能力。
- 了解不同模型在实际应用场景中的表现。
- 为医学影像领域的从业人员提供参考,帮助他们选择合适的模型。