数据集概述
本数据集包含四份Excel文件,为基于组织学图像预测胃肠癌微卫星不稳定性(MSI)的相关原始数据,对应论文“Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer”的扩展数据图1和图2,涵盖神经网络模型对比、不同队列患者的MSIness预测及原始数据。
文件详解
- Network_comparison.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含不同神经网络模型在肿瘤检测基准任务上对比的原始数据,每行对应一个样本相关的模型对比记录,与扩展数据图1相关。
- TCGA_GI_Test_set_predictions.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含TCGA-CRC-KR、TCGA-CRC-DX、TCGA-STAD测试集患者的MSIness预测数据,每行对应一个患者的预测结果,与扩展数据图2相关。
- DACHS_predictions.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含DACHS队列患者的MSIness预测数据,每行对应一个患者的预测结果,与扩展数据图2相关。
- DACHS_MSIness_in_geneticMSS.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含基因层面微卫星稳定(MSS)的DACHS患者的MSIness原始数据,每行对应一个患者的原始数据记录,与扩展数据图2相关。
数据来源
论文“Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer”
适用场景
- 胃肠癌MSI预测模型研究: 利用Network_comparison.xlsx分析不同神经网络模型在肿瘤检测任务中的性能差异,优化MSI预测模型。
- 医学检测验证: 通过TCGA和DACHS队列的预测数据,验证深度学习模型预测胃肠癌MSI的准确性和泛化能力。
- 临床病理研究: 结合基因层面MSS患者的MSIness原始数据,探索组织学特征与MSI状态的关联。
- 医学数据挖掘: 整合多队列预测数据,挖掘胃肠癌MSI相关的潜在生物标志物或临床规律。