数据集概述
本数据集包含裂殖蝇类(含果蝇、家蝇等55000种)系统发育转录组学研究的全基因氨基酸序列数据,涉及70个物种的3145个基因。数据用于解析裂殖蝇类快速辐射的系统发育关系,为理解其农业、医学及法医学重要性物种的多样性形成机制提供支持,共含13个相关文件。
文件详解
- 文档文件
- 文件名称:BeyondDrosophilaDataDryadReadme.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文档,包含研究背景、数据用途及文件清单等信息
- 序列矩阵文件
- 文件名称:NT70taxa123pos_3145genessupermatrix.nt.genes.final.charset、NT70taxa123pos_1130supermatrix.nt.genes.final.charset、70taxa2_aa.alistat80mask.rename.reorder.phy、70taxa1130genesDATArename.phy、NT70taxa123pos_3145genes.phy、NT70taxa123_1130genes.phy
- 文件格式:CHARSET、PHY
- 字段映射介绍:含70个物种的核苷酸/氨基酸序列超级矩阵,记录基因位点、物种分类及序列信息
- 分区文件
- 文件名称:70taxa1130genesPARTITIONS.txt、NT70taxa_1130g_736part_partitionfinder.txt、70taxaAA_1130g_132part_partitionfinder.txt、70taxa_aa_part_unred_partitions.txt
- 文件格式:TXT
- 字段映射介绍:序列数据的分区信息,包含子集划分、最佳模型(如LG+G、JTTDCMut等)及对应基因列表
- 系统发育树文件
- 文件名称:BeyondDrosophila_Baylessetal_trees.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内含研究得到的系统发育树结果文件
数据来源
Dryad数据平台(对应论文:Beyond Drosophila: resolving the rapid radiation of schizophoran flies with phylotranscriptomics)
适用场景
- 昆虫系统发育关系研究:解析裂殖蝇类主要类群的系统发育分支框架,验证单系群及姐妹群关系
- 分子进化分析:基于全基因氨基酸序列数据,研究裂殖蝇类快速辐射的分子进化机制
- 物种多样性机制探究:结合系统发育结果,分析农业、医学重要蝇类多样性形成的生态与遗传驱动因素
- 比较基因组学研究:为裂殖蝇类的基因功能、生态适应性及生物防治应用提供基础数据支持
- 系统发育方法优化:用于测试最大似然法、多物种 coalescent 法等不同系统发育分析方法的效果