Maker_Based_Eukaryotic_Genome_注释完整数据

数据集概述

本数据集包含使用Maker工具进行真核生物基因组注释的输入与输出数据,涵盖基因组序列、注释结果、统计报告及训练模型等23个文件,为基因组功能注释研究提供完整数据支持。

文件详解

该数据集由多种类型文件组成,具体说明如下: - 基因组序列与注释文件: - genome.fasta:FASTA格式,基因组原始序列文件 - cds.fasta、gffread_cds.fasta、gffread_exons.fasta:FASTA格式,编码序列及外显子序列文件 - map_annotation_ids.gff3:GFF3格式,注释ID映射文件 - BUSCO评估文件: - BUSCO_short_summary_01.txt至04.txt:TXT格式,BUSCO注释完整性评估摘要 - BUSCO_full_table_01.tabular:TABULAR格式,BUSCO完整评估结果表 - BUSCO_missing_orthologs_01.tabular:TABULAR格式,缺失直系同源基因信息 - 统计与报告文件: - genome_annotation_statistics_summary_02.txt:TXT格式,注释统计摘要 - genome_annotation_statistics_graphs_01.pdf至03.pdf:PDF格式,注释统计图表 - fasta_statistics.tabular:TABULAR格式,FASTA序列统计数据 - jbrowse_report.zip:ZIP格式,JBrowse可视化报告压缩包 - 训练模型文件: - augus_trained_model.augustus:AUGUSTUS格式,Augustus训练模型 - SNAP_trained_model.snaphmm:SNAP格式,SNAP训练模型

适用场景

  • 基因组学研究:真核生物基因组功能注释结果分析与验证
  • 生物信息学分析:基因组注释工具性能评估与模型训练
  • 分子生物学研究:编码序列与蛋白质功能预测
  • 生物数据可视化:基因组注释结果的可视化展示与报告生成
  • 统计建模:基因组注释统计模型构建与验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 10.51 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。