数据集概述
本数据集包含用于COVID-19检测机器学习模型开发、评估与验证的血液检测数据,涵盖圣拉斐尔医院2020年2-5月1624名患者的全血细胞计数、生化、凝血等血液指标及人口学特征,另有其他医院58例及2018年54例阴性患者数据用于验证,支持COVID-19辅助诊断模型研究。
文件详解
- 文件名称:all_training.xlsx
- 文件格式:XLSX
- 字段映射介绍:
- ID(第一列):区分数据用途(Axxxx-为训练数据,20xx为内外部验证数据,其余为外部验证数据)
- Target:目标变量(1=COVID-19阳性,0=COVID-19阴性)
- Sex:性别(1=男性,0=女性)
- 其他特征:包含全血细胞计数(CBC)、生化指标、凝血指标、血气分析、年龄及分诊症状等72项血液检测相关特征
数据来源
论文“Development, evaluation, and validation of machine learning models for COVID-19 detection based on routine blood tests”
适用场景
- COVID-19辅助诊断模型开发: 利用血液检测数据训练机器学习模型,辅助rRT-PCR进行快速低成本的COVID-19检测
- 血液指标与COVID-19关联性分析: 研究常规血液检测指标对COVID-19感染的预测价值
- 医疗资源优化应用: 为资源有限地区或疫情高发期提供替代诊断方案参考
- 机器学习模型性能验证: 用于评估不同特征集(全量、COVID特异性、CBC)下模型的诊断效能