数据集概述
本数据集是论文《MAMSI: 基于多视图机器学习的多检测液相色谱-质谱代谢组学数据整合》的补充数据,包含英国国家表型组中心(NPC)两项研究的多检测代谢组学数据,支持多视图机器学习分析。
文件详解
- 文件名称: AddNeuroMed Serum.zip
- 文件格式: ZIP压缩包
- 内容说明: 包含AddNeuroMed研究的血清样本多检测LC-MS数据,涉及HILIC+、Lipid RPC+、Lipid RPC-三种检测,对应特征数分别为681、4886、2091,共577名受试者数据
- 文件名称: MY Diabetes Urine.zip
- 文件格式: ZIP压缩包
- 内容说明: 包含MY DIABETES研究的尿液样本多检测LC-MS数据,涉及HILIC+、SmMol RPC+、SmMol RPC-三种检测,对应特征数分别为2600、12817、7142
- 文件名称: MY Diabetes Serum.zip
- 文件格式: ZIP压缩包
- 内容说明: 包含MY DIABETES研究的血清样本多检测LC-MS数据,涉及HILIC+、Lipid RPC+、Lipid RPC-三种检测,对应特征数分别为613、1771、907,共984名受试者数据
数据来源
英国国家表型组中心(UK National Phenome Centre, NPC)
适用场景
- 代谢组学多视图数据分析: 用于验证多检测LC-MS数据整合的机器学习模型(如MAMSI方法)
- 疾病生物标志物研究: 探索阿尔茨海默病、1型糖尿病相关的代谢组学特征
- 人群代谢差异分析: 分析不同 ancestry、性别群体的代谢谱差异
- 质谱数据预处理方法评估: 验证ProteoWizard、XCMS等工具的预处理效果
- 临床代谢组学应用: 支持代谢组学在神经退行性疾病、糖尿病临床研究中的应用