数据集概述
本数据集包含基因组注释Maker工作流的输入与输出文件,涵盖注释结果、统计摘要、可视化图表等多类型文件,为基因组注释研究提供完整数据支持。
文件详解
该数据集包含17个文件,具体说明如下:
- 核心注释结果文件:
- Maker_final_annotation.gff3:GFF3格式,基因组最终注释结果
- Map_annotation_ids_renamed.gff:GFF格式,注释ID映射重命名文件
- Maker_full_gff_evidences_final_annotation.gff3:GFF3格式,含证据的完整注释文件
- Maker_evidences.gff3:GFF3格式,注释证据文件
- gffread_exons.fasta:FASTA格式,外显子序列文件
- 统计与摘要文件:
- Genome_annotation_statistics_summary.txt:TXT格式,基因组注释统计摘要
- Busco_genome_short_summary.txt:TXT格式,BUSCO基因组注释短摘要
- Busco_proteins_short_summary.txt:TXT格式,BUSCO蛋白质注释短摘要
- Genome_annotation_statistics_graphs.pdf:PDF格式,注释统计图表
- Busco_proteins_summary_image.png:PNG格式,蛋白质注释摘要图片
- 表格数据文件(.tabular格式):
- Busco_genome_missing_buscos.tabular:基因组缺失BUSCO序列表格
- Busco_proteins_full_table.tabular:蛋白质完整注释表格
- Busco_genome_full_table.tabular:基因组完整注释表格
- Map_annotation_ids_ID_map.tabular:注释ID映射关系表格
- Busco_proteins_GFF.gff3:GFF3格式,蛋白质注释GFF文件
适用场景
- 基因组学研究:分析基因组注释结果与结构特征
- 蛋白质组学分析:研究蛋白质注释数据与功能关联
- 生物信息学方法验证:评估Maker注释流程的准确性与完整性
- 基因组可视化研究:基于注释统计图表开展基因组结构可视化分析
- 进化生物学研究:通过BUSCO数据评估基因组完整性与进化关系