数据集概述
本数据集包含Ochnaceae科植物的DNA序列比对文件,涵盖单个基因比对和所有基因串联比对结果,以及用于核基因靶向富集的探针序列诱饵集。数据支撑相关论文中的系统发育分析,涉及超过250个分类群,共6个文件。
文件详解
- 串联比对文件
- 文件名称:Alignment_concatenated_SLT_dataset.fas、Alignment_concatenated_LEO_dataset.fasta、Alignment_concatenated_FAM_dataset.fasta
- 文件格式:FAS、FASTA
- 字段映射介绍:FASTA格式的DNA序列比对文件,序列头中的数字对应标本实验室ID(凭证信息见相关文献),包含所有基因位点串联后的序列数据
- 单个基因比对压缩包
- 文件名称:Gene_alignments_LEO_dataset.zip、Gene_alignments_FAM_dataset.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含按基因位点编号区分的单个基因比对文件,用于系统发育分析
- 诱饵集文件
- 文件名称:Bait_set_Ochnaceae-120-32-noRM.fas.txt
- 文件格式:TXT
- 字段映射介绍:TXT格式的FASTA序列文件,包含用于Ochnaceae科核基因靶向富集的探针序列,序列头包含 scaffold 信息和物种名称
数据来源
Schneider et al. (2020)发表于Taxon的论文“Phylogenomics of the tropical plant family Ochnaceae using targeted enrichment of nuclear genes and 250+ taxa”
适用场景
- 植物系统发育研究:用于分析Ochnaceae科植物的亲缘关系和进化历史
- 核基因靶向富集技术验证:基于诱饵集序列评估探针设计的有效性
- 植物分类学研究:结合序列比对数据完善Ochnaceae科的分类系统
- 分子进化分析:利用单个基因和串联比对数据探究基因进化模式