数据集概述
本数据集是针对北美特有植物Penstemon属的基因预测与注释结果,通过MAKER2注释流程从6个极低覆盖度(约0.005×−0.007×)基因组中识别基因区域,支持系统发育标记开发。包含基因注释文件、序列文件等5个文件,可用于下游引物设计及序列分化分析。
文件详解
- 文件名称:Penstemon-MAKER-FuncAnnots.xlsx
- 文件格式:XLSX
- 字段映射介绍:MAKER2生成的功能注释结果文件,包含基因功能注释相关信息
- 文件名称:Hit-desc.pl
- 文件格式:PL
- 字段映射介绍:用于处理注释结果的脚本文件
- 文件名称:MakerProtein.fasta
- 文件格式:FASTA
- 字段映射介绍:MAKER2预测的蛋白质序列文件
- 文件名称:MakerEST.fasta
- 文件格式:FASTA
- 字段映射介绍:MAKER2预测的表达序列标签(EST)文件
- 文件名称:Penstemon.hmm
- 文件格式:HMM
- 字段映射介绍:用于基因预测的隐马尔可夫模型文件
数据来源
论文“Gene prediction and annotation in Penstemon (Plantaginaceae): a workflow for marker development from extremely low-coverage genome sequencing”
适用场景
- Penstemon属系统发育研究: 基于注释基因序列开发系统发育标记,解析280个物种的进化关系
- 低覆盖度基因组基因标记开发: 验证MAKER2流程在极低覆盖度基因组中识别基因区域的有效性
- 基因序列分化分析: 利用注释序列分析Penstemon物种间的序列分歧水平
- 植物基因组注释方法优化: 对比MAKER2与BLAST方法的基因区域识别效果,优化注释流程