数据集概述
本数据集是豆科Psoralea属分类学研究的配套文件,包含系统发育分析相关的样本信息、数据处理结果及进化树文件。数据支撑Psoralea属的分类修订研究,涵盖样本ENA登录号、缺失数据与旁系同源基因统计、位点共识序列、比对序列、基因树及物种树等内容,共7个文件。
文件详解
- 1_Appendix S1_ENA_Accessions.xlsx(XLSX格式):包含研究使用的样本信息、分类学信息、IPNI编号、凭证标本信息及ENA登录号,提供HybPiper分析的位点恢复统计数据。
- 2_Hybphaser_Summary_missing_data.txt(TXT格式):HybPhaser脚本输出,记录基于配置阈值排除的位点和样本信息,用于减少缺失数据。
- 3_Hybphaser_Summary_Paralogs.txt(TXT格式):HybPhaser脚本输出,记录基于配置阈值排除的旁系同源基因位点和样本信息。
- 4_loci_consensus.tar.gz(GZ压缩包格式):包含经阈值筛选后的每个位点和样本的共识序列文件。
- 5_loci_Aligned.tar.gz(GZ压缩包格式):包含经Mafft比对、Treeshrink处理后的位点比对序列文件。
- 6_IQTREE.tar.gz(GZ压缩包格式):包含使用IQTree为每个位点矩阵生成的基因树文件。
- 7_Astral.tre(TRE格式):使用Astral构建的合并物种树文件,以补骨脂(Cullen corylifolium)为外类群。
适用场景
- 豆科植物分类学研究:用于Psoralea属的亚属级分类修订与系统发育关系分析。
- 系统发育基因组学分析:利用基因树与物种树数据,研究Psoralea属的进化历史。
- 生物信息学方法验证:评估HybPhaser、Mafft、IQTree、Astral等工具在分类学研究中的应用效果。
- 植物样本资源整合:通过ENA登录号与凭证标本信息,关联Psoralea属的分子数据与实体标本资源。