数据集概述
本数据集围绕美洲风铃草质体基因组展开,包含基因序列比对、PAML分析输入输出等文件,用于研究种间分化与种内多态性的相关性,探索快速进化质体基因组在跨时间尺度下的相似进化机制,涉及基因选择压力、结构变异等核心内容。
文件详解
- 单基因比对文件
- 文件名称:SingleGeneAlignments.zip
- 文件格式:ZIP(内含文本文件)
- 字段映射介绍:包含美洲风铃草所有蛋白编码质体基因与3个外类群物种(Trachelium caeruleum、Nicotiana tabacum、Helianthus annuus)的四物种基因比对序列
- 基因拼接比对文件
- 文件名称:PAMLAlignments.zip
- 文件格式:ZIP(内含文本文件)
- 字段映射介绍:包含用于PAML分析的基因拼接序列比对文本文件
- PAML分析输入文件
- 文件名称:PAMLInputFiles.zip
- 文件格式:ZIP(内含ctl文本文件、树文件)
- 字段映射介绍:包含运行PAML分析所需的codeml.ctl控制文件和进化树文件
- PAML分析输出文件
- 文件名称:PAMLOutputFiles.zip
- 文件格式:ZIP
- 字段映射介绍:包含PAML分析生成的输出文件
- 单基因比对说明文件
- 文件名称:README_for_SingleGeneAlignments.txt
- 文件格式:TXT
- 字段映射介绍:说明单基因比对文件的内容与外类群物种信息
- clpP基因比对文件
- 文件名称:clpPAlignment.phy
- 文件格式:PHY
- 字段映射介绍:包含clpP基因的序列比对数据
数据来源
论文“Correlation between sequence divergence and polymorphism reveals similar evolutionary mechanisms acting across multiple timescales in a rapidly evolving plastid genome”
适用场景
- 质体基因组进化机制研究:分析种间分化与种内多态性的相关性,探索跨时间尺度的进化规律
- 基因选择压力分析:利用PAML输入输出文件研究质体基因的dN/dS、pN/pS等选择压力指标
- 植物系统发育分析:基于单基因/拼接基因比对序列构建进化树,解析物种亲缘关系
- 种内遗传多样性研究:通过种内多态性数据探索质体基因组的结构变异与遗传分化
- 比较基因组学分析:对比美洲风铃草与外类群物种的质体基因序列,研究进化差异