数据集概述
本数据集包含DIA-BERT研究相关的源数据与分析文件,分为两个文件:Source Data.xlsx存储主手稿及补充信息中所有图表的原始数据,按图表分工作表组织;Files.zip压缩包内含五个Excel文件,涵盖DIA-NN与DIA-BERT的鉴定对比、肽前体与蛋白质鉴定结果、模拟数据参数、定量结果及多物种数据集定量性能比较等内容。
文件详解
- Source Data.xlsx
- 文件格式:XLSX
- 字段映射介绍:按主手稿及补充信息中的图表分设独立工作表,存储对应图表的原始数据,具体字段因图表主题而异
- Files.zip
- 文件格式:ZIP
- 包含文件:
- File 1.xlsx:DIA-NN与DIA-BERT鉴定结果的比较摘要
- File 2.xlsx:DIA-NN(基于库模式)与DIA-BERT鉴定的肽前体及蛋白质信息
- File 3.xlsx:经修改的Synthesia生成的模拟数据参数
- File 4.xlsx:DIA-NN(基于库模式)与DIA-BERT在联合搜索中的肽前体及蛋白质定量结果
- File 5.xlsx:不同定量模型的DIA-BERT与DIA-NN在三物种数据集上的定量性能比较
数据来源
Zenodo平台
适用场景
- 蛋白质组学鉴定方法比较:分析DIA-NN与DIA-BERT在肽段和蛋白质鉴定上的差异与性能
- 定量模型评估:研究不同定量模型对DIA-BERT定量性能的影响
- 模拟数据参数优化:基于模拟数据参数探索蛋白质组学数据模拟的改进方向
- 多物种数据集分析:比较多物种数据集上不同方法的定量准确性
- 学术研究复现:支持DIA-BERT相关研究成果的验证与复现