数据集概述
该数据集是羊膜动物原弹性蛋白序列的综合数据库,包含八十余种羊膜动物的基因组序列与外显子识别信息,合弓纲与蜥形纲物种数量相近,覆盖羊膜动物各亚群。数据用于提供经整理的外显子级原弹性蛋白序列,支持进化保守特征、密码子使用等多维度分析。
文件详解
数据集包含多个目录和文件,具体说明如下:
- 说明与辅助文件:
- General Introductory Notes.docx: DOCX格式,可能为数据库的总体介绍文档。
- Figure 1 - Evolutionary relationships between species.pdf: PDF格式,展示物种间进化关系的图表文件。
- List of Species.docx: DOCX格式,记录数据库涵盖的物种列表。
- Table 1 Consensus domain sequences of amniotes, Aug 14-25.xlsx: XLSX格式,记录羊膜动物共有结构域序列的表格文件。
- 序列数据文件 (位于Sequence data/目录下):
- 按物种分类存储的DOCX格式文件,例如Sequence data/Sauropsids/Archosaurs/6.1.15 Australian Ostrich.docx、Sequence data/Synapsids/1. Primates/1.1 Great Apes/1.1.1 Human.docx等,包含各物种原弹性蛋白的序列信息。
适用场景
- 进化生物学研究: 分析原弹性蛋白在三亿余年进化中的保守特征与序列变化规律。
- 分子遗传学研究: 探究密码子使用偏好、可变剪接调控机制。
- 基因组学分析: 研究内含子及非翻译区序列对基因表达的影响。
- 比较生物学研究: 对比合弓纲与蜥形纲物种原弹性蛋白的结构与功能差异。