补充数据_植物生命树基因组规模系统发育数据

数据集概述

本数据集为论文“Genome-Scale Phylogenetics: Inferring the Plant Tree of Life from 18,896 Discordant Gene Trees”的补充数据,包含18,896个基因树的处理结果,涉及136个植物类群的510,922条蛋白质序列,用于通过基因树简约法分析植物系统发育关系,解决基因树不一致问题,支持植物生命树的构建与争议节点解析。

文件详解

  • README_for_UnigeneAlignments.txt
  • 文件格式:TXT
  • 字段映射介绍:补充数据说明文档,包含数据集背景、文件内容说明(如UnigeneAlignments文件夹的18,896个掩码氨基酸比对文件)、文件命名规则(Phytome集群编号)、序列格式(phylip格式)及序列标识说明。
  • UnigeneAlignments.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩归档文件,包含18,896个掩码氨基酸比对文件,每个文件对应一个基因树的比对数据,用于植物基因组系统发育分析。

数据来源

论文“Genome-Scale Phylogenetics: Inferring the Plant Tree of Life from 18,896 Discordant Gene Trees”

适用场景

  • 植物系统发育研究: 利用基因树简约法分析136个植物类群的基因组数据,构建植物生命树并解析争议节点。
  • 基因树不一致性分析: 研究植物基因复制与丢失导致的基因树与物种树差异,优化系统发育推断方法。
  • 植物分类学验证: 验证木兰类与真双子叶+单子叶分支的亲缘关系,评估 eurosid I 和 II 分支的支持度。
  • 基因组数据算法测试: 测试基因树简约法新软件在大规模数据集(18,896个基因树)上的运行性能与准确性。
  • 植物进化生物学研究: 从核基因组视角探究植物大类群的系统发育关系,支持进化机制分析。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 28.49 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。