数据集概述
本数据集为压缩文件,包含用于将Prymnesium parvum 12B1的PKZILLA匹配蛋白组肽段分类为蛋白唯一、蛋白多匹配、外显子唯一、外显子多匹配类别的源数据文件、Jupyter分析笔记本及工作流结果文件,支持肽段分类分析。
文件详解
- 压缩文件(Proteomics num. 5, v17 analysis.zip)
- 文件格式:ZIP
- 包含关键文件:
- PKZILLA-1_classify_peptides.txt:PKZILLA-1分类肽段数量的纯文本报告
- PKZILLA-2_classify_peptides.txt:PKZILLA-2分类肽段数量的纯文本报告
- ./hierarchical_classified_xlsx/:含PKZILLA-1和PKZILLA-2分类肽段的Excel表格目录
- ./Process_into_polypeptide_coordinates/:肽段回对齐至PKZILLA基因组位点的工作流、结果及图表目录
数据来源
Zenodo数据集(https://doi.org/10.5281/zenodo.10023441)
适用场景
- 蛋白组肽段分类研究:分析PKZILLA匹配肽段的蛋白及外显子层面分类特征
- 生物信息学工作流验证:复现肽段分类及基因组回对齐的分析流程
- 藻类蛋白组学分析:支持Prymnesium parvum 12B1的PKZILLA蛋白组数据深度解析
- 肽段注释方法优化:基于分类结果改进蛋白或外显子水平的肽段注释策略