数据集概述
本数据集为Solidago属(菊科)植物标本基因组测序研究成果,通过对1970-2010年采集的95份标本进行基因分型测序,结合UNEAK流程处理获得单核苷酸多态性(SNP)数据,用于评估标本基因组在物种界定与系统发育中的应用价值,共包含20个文件。
文件详解
- 数据处理配置文件(XML格式)
- 文件名称:FastqToTagCountPlugin.xml、MergeTagsByTaxaFilesPlugin.xml、MergeDuplicateSNPsPlugin.chr1.xml等12个XML文件
- 文件格式:XML
- 字段映射介绍:记录基因测序数据处理流程的配置参数,涵盖序列比对、标签合并、SNP去重等分析步骤的参数设置
- 基因型数据文件(TXT格式)
- 文件名称:Squarrosae_30percent_hapmap.hmp.txt、Junceae_70percent_hapmap.hmp.txt、Triplinerviae_70percent_hapmap.hmp.txt、Solidago_keyfile.txt等7个TXT文件
- 文件格式:TXT
- 字段映射介绍:包含不同亚组(Squarrosae、Junceae、Triplinerviae)的基因型数据(hapmap格式)及样本信息(Solidago_keyfile.txt含样本ID、物种分类、测序参数等元数据)
- 分析选项文件(XLSX格式)
- 文件名称:Solidago_TASSEL_options.xlsx
- 文件格式:XLSX
- 字段映射介绍:记录TASSEL分析工具的参数配置选项,用于指导基因组数据的处理与分析
数据来源
论文“Next-generation sampling: pairing genomics with herbarium specimens provides species-level signal in Solidago (Asteraceae)”
适用场景
- 植物物种界定研究:利用SNP数据评估标本基因组在Solidago属物种分类中的分辨率
- 系统发育分析:基于基因型数据重建Solidago属不同亚组的亲缘关系
- 标本基因组学方法验证:验证馆藏标本DNA用于下一代测序的可行性与可靠性
- 植物分类学应用:为菊科等物种丰富类群的分类修订提供基因组学依据
- 生物多样性研究:结合标本信息分析Solidago属物种的地理分布与遗传多样性