数据集概述
本数据集为蝇类生命树演化辐射研究的系统发育基因组学数据,包含149个蝇科的分子(核基因、线粒体基因组)与形态学数据,用于揭示蝇类三次快速辐射事件及食性转变历史,支持昆虫演化、基因组比较等研究,共36份文件。
文件详解
- 基因序列文件(.fasta格式)
- 部分文件名:CAD_noIntrons.alnFLYTREE.fasta、GART_alnFLYTREE.fasta、Nad1-alnFLYTREE.fasta、PEPCK_alnFLYTREE.fasta、SNF_alnFLYTREE.fasta、G6PD_alnFLYTREE.fasta、Nad4-alnFLYTREE.fasta
- 文件格式:FASTA
- 字段映射介绍:包含核基因(如CAD、GART、G6PD)、线粒体基因(如Nad1、Nad4)的多序列比对数据,用于系统发育分析
- 系统发育分析文件(.nex格式)
- 部分文件名:fly2.28s.nex、28S.aln5.22.09.nex
- 文件格式:NEXUS
- 字段映射介绍:包含28S核糖体RNA等基因的比对数据,用于构建系统发育树
- 压缩包文件(.zip格式)
- 部分文件名:FLYTREEmitoGeneAln.zip、FLYTREENuclearGenes_ALN.zip
- 文件格式:ZIP
- 字段映射介绍:分别压缩了线粒体基因、核基因的多序列比对文件集合
- 注释文件(.xls格式)
- 文件名:FLY dataset annotations.xls
- 文件格式:XLS
- 字段映射介绍:蝇类数据集的注释信息,可能包含样本分类、基因对应关系等元数据
- 文本文件(.txt格式)
- 文件名:Textnames.txt
- 文件格式:TXT
- 字段映射介绍:包含科、种等分类信息及基因(28S、cad、tpi等)、外类群等数据列标题,如Micropterigidae科Micropterix calthella种的基因对应信息
数据来源
论文“Episodic radiations in the fly tree of life”
适用场景
- 昆虫系统发育研究: 利用基因序列数据构建蝇类生命树,分析演化关系与分类地位
- 生物演化辐射事件分析: 研究蝇类三次快速辐射的时间节点(2.2亿年、1.8亿年、6500万年)及驱动因素
- 基因组比较研究: 对比核基因与线粒体基因数据,探究不同基因在演化分析中的应用价值
- 昆虫食性转变研究: 结合系统发育结果,分析蝇类演化中吸血、植食、寄生等生活史转变的历史
- 生物信息学方法验证: 测试多基因联合分析、形态学与分子数据整合在系统发育研究中的效果