数据集概述
本数据集为验证非小细胞肺癌纵隔淋巴结转移预测的机器学习工具而构建,包含运行最终GBM模型所需的10个特征的匿名化患者数据,以及相关Python脚本和输出文件,支持复现研究结果。
文件详解
该数据集包含8个文件,具体说明如下:
- 说明文档类:
- content_description_2025_07_20.txt:TXT格式,文件内容描述文档
- WP22_Open_Data_Dictionary_2025_07_20.pdf:PDF格式,数据字典文档
- 数据文件类:
- WP22_Patient_2025_07_20_english_anonymized.csv:CSV格式,匿名化患者数据,包含cohort、SUVmax、直径等特征字段
- WP22_Patient_2025_07_20_english_anonymized.sav:SAV格式,匿名化患者数据文件
- WP22_sklearn_robust_scaled_gbm_final_n10_predictions.csv:CSV格式,GBM模型预测结果文件
- WP22_sklearn_robust_scaled_gbm_final_n10_predictions.sav:SAV格式,GBM模型预测结果文件
- 代码文件类:
- WP22_2025_07_20-gbm_final-n10-predict_english_csv_anonymized.ipynb:IPYNB格式,Python Jupyter Notebook脚本
- WP22_2025_07_20-gbm_final-n10-predict_english_csv_anonymized.py:PY格式,Python脚本
适用场景
- 医学影像AI模型验证:验证基于FDG-PET/CT参数的淋巴结转移预测模型性能
- 肺癌临床研究:分析非小细胞肺癌纵隔淋巴结转移相关特征
- 机器学习方法应用:探索GBM模型在医疗数据中的应用
- 医学数据共享研究:支持医疗匿名化数据的开放科学实践