数据集

古人类蛋白质组学参考数据集

数据集概述

本数据集是使用PaleoProPhyler工具生成的古人类蛋白质组学参考数据集，包含来自古代和现代人类的蛋白质序列。涵盖一百七十六个公开基因组及八个古人类基因组（三个尼安德特人、一个丹尼索瓦人），针对骨骼或牙齿中已报道的蛋白质进行翻译，共得到约一万零五十八条序列。

文件详解

该数据集为压缩文件，包含以下内容： - PalaeoProPhyler_Publication_Data_for_Tree.fa：FASTA格式文件，包含用于生成系统发育树的所有序列 - ALL_PROT_REFERENCE.fa：FASTA格式文件，包含所有古人类蛋白质组参考数据集的序列 - PER_PROTEIN文件夹：包含每个蛋白质对应的FASTA文件，每个文件包含所有个体该蛋白质的序列 - PER_SAMPLE文件夹：包含每个样本对应的FASTA文件，每个文件包含该样本所有蛋白质的序列 - Reference_Protein_List.txt：TXT格式文件，两列数据，第一列为选定翻译的蛋白质列表，第二列为蛋白质提及或鉴定来源（出版物标题或"our samples"标记，多来源用逗号分隔）

适用场景

古蛋白质组学研究：用于古代人类蛋白质序列的比对与分析
分子系统发育分析：构建古人类演化的系统发育树
生物考古学研究：探索古人类骨骼、牙齿中蛋白质的分布与特征
蛋白质演化研究：分析不同人类群体蛋白质序列的变异模式

数据与资源

7728060.zipZIP
276.27 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	276.27 MiB
最后更新	2025年12月5日
创建于	2025年12月5日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。