数据集概述
本数据集是用于机器学习分析的标准化最终数据,来自IMMUNO_COV研究中116名健康个体接种第三剂mRNA新冠疫苗后的血清学数据。包含18项体液和细胞免疫变量及既往感染数据,通过个体ID整合,用于识别未察觉既往感染者、分析混合免疫与疫苗诱导免疫特征。
文件详解
- 文件名称:ML_ADHVII dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:
- 应答者聚类:基于tSNE降维数据的GMM聚类结果(针对野生型、Delta、Omicron BA.1/BA.2的刺突蛋白、RBD抗原抗体浓度及ACE-2/RBD结合抑制值,共12个变量)
- 分类器:多数投票共识法结果(包含上述12个变量及BA.2 N蛋白特异性IgG的AUC值,共13个变量)
- 感染状态:0=未感染;1=第三剂前感染;2=第三剂后感染
- 感染天数:感染日期与第三剂接种后6个月采血日期的间隔天数
- 抗体浓度:野生型、Delta、Omicron BA.1/BA.2的刺突蛋白及RBD特异性IgG浓度(ng/ml)
- 结合抑制率:血浆抗体对不同变异株ACE-2/RBD相互作用的抑制百分比
- BA.2 N蛋白IgG AUC:Omicron BA.2核衣壳蛋白特异性IgG的曲线下面积
- 记忆B细胞频率:野生型核衣壳、刺突蛋白、RBD特异性IgG分泌记忆B细胞频率(ELISPOT检测)及循环野生型RBD特异性B细胞频率(流式细胞术检测)
数据来源
论文“Machine Learning Approaches to Dissect Hybrid and Vaccine-Induced Immunity”(作者G. Montesi、S. Costagli等)
适用场景
- 疫苗诱导免疫特征分析:利用聚类和分类器结果,解析混合免疫与疫苗诱导免疫的差异及关键免疫标志物
- 既往感染状态识别:通过机器学习模型挖掘血清学数据中未察觉既往感染的特征
- 免疫应答异质性研究:分析不同变异株抗体反应、结合抑制率与记忆B细胞频率的个体差异
- 疫苗保护效果评估:关联免疫指标与感染状态,评估第三剂mRNA疫苗对不同变异株的免疫保护作用
- 免疫变量关联性分析:探索体液免疫(抗体浓度、结合抑制率)与细胞免疫(记忆B细胞)指标的相关性