古人类蛋白质组学参考数据集

数据集概述

本数据集是使用PaleoProPhyler工具生成的古人类蛋白质组学参考数据集,包含来自古代和现代人类的蛋白质序列。涵盖一百七十六个公开基因组及八个古人类基因组(三个尼安德特人、一个丹尼索瓦人),针对骨骼或牙齿中已报道的蛋白质进行翻译,共得到约一万零五十八条序列。

文件详解

该数据集为压缩文件,包含以下内容: - PalaeoProPhyler_Publication_Data_for_Tree.fa:FASTA格式文件,包含用于生成系统发育树的所有序列 - ALL_PROT_REFERENCE.fa:FASTA格式文件,包含所有古人类蛋白质组参考数据集的序列 - PER_PROTEIN文件夹:包含每个蛋白质对应的FASTA文件,每个文件包含所有个体该蛋白质的序列 - PER_SAMPLE文件夹:包含每个样本对应的FASTA文件,每个文件包含该样本所有蛋白质的序列 - Reference_Protein_List.txt:TXT格式文件,两列数据,第一列为选定翻译的蛋白质列表,第二列为蛋白质提及或鉴定来源(出版物标题或"our samples"标记,多来源用逗号分隔)

适用场景

  • 古蛋白质组学研究:用于古代人类蛋白质序列的比对与分析
  • 分子系统发育分析:构建古人类演化的系统发育树
  • 生物考古学研究:探索古人类骨骼、牙齿中蛋白质的分布与特征
  • 蛋白质演化研究:分析不同人类群体蛋白质序列的变异模式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 276.27 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。