数据集概述
本数据集为菊科系统发育基因组学研究成果,包含23个菊科物种及1个近缘科物种的测序数据。通过靶向捕获低拷贝序列与Illumina测序,生成795个核基因位点数据及叶绿体基因组数据,采用保守单拷贝基因与多拷贝基因聚类两种方法构建系统发育关系,为解析大型植物科的复杂亲缘关系提供方法框架与数据支撑。
文件详解
- 系统发育树文件
- 文件名称:astral_conservative.tre、conservative_COS_concatenated.tre、chloroplast.tre、100_random_clusters_for_network.tre
- 文件格式:TRE
- 字段映射介绍:分别为保守单拷贝基因的ASTRAL树、保守单拷贝基因串联树、叶绿体基因组树、多拷贝基因随机聚类网络树,记录物种间的系统发育关系拓扑结构
- 序列文件
- 文件名称:conservative_COS_concatenated.fasta、chloroplast_all_final.fasta
- 文件格式:FASTA
- 字段映射介绍:分别为保守单拷贝基因串联序列、所有样本的叶绿体基因组序列,包含物种标识与核苷酸序列信息
- 聚类结果文件
- 文件名称:low_copy_cluster_trees.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内含低拷贝基因聚类的系统发育树文件,记录多拷贝基因的聚类关系
- 热图数据文件
- 文件名称:Gitools_heatmap_all_clusters.csv、Gitools_heatmap_conservative_COS.csv
- 文件格式:CSV
- 字段映射介绍:分别为所有基因聚类的热图数据、保守单拷贝基因的热图数据,列名为物种名称,记录基因表达或聚类的数值矩阵
数据来源
论文“Using phylogenomics to resolve mega-families: an example from Compositae”
适用场景
- 植物系统发育研究:用于解析菊科内部及与近缘科的亲缘关系,验证大型植物科的单系性
- 基因家族进化分析:通过多拷贝基因聚类数据,研究菊科基因家族的扩张与收缩机制
- 系统发育方法比较:对比核基因与叶绿体基因组、单拷贝与多拷贝基因构建系统发育树的差异
- 大型植物科研究框架构建:为其他大型植物科的系统发育基因组学研究提供方法参考与数据模板
- 物种亲缘关系验证:通过不同数据集构建的系统发育树,验证已知菊科物种的分类地位