摩洛哥阿甘树端粒到端粒分相基因组注释数据集2025

数据集概述

本数据集为摩洛哥阿甘树(Argania spinosa)的分相端粒到端粒(T2T)染色体级基因组组装提供完整注释支持,包含两个全分相单倍型的结构基因注释、预测蛋白序列及重复序列注释文件,助力该生态与经济重要树种的遗传研究。

文件详解

  • 结构基因与蛋白注释文件包:Sideroxylon_spinosum_functional_annotation.zip
  • 包含GFF3格式的结构基因注释文件(Funannotate流程生成)
  • 包含FASTA格式的预测蛋白序列文件
  • 基因预测结合转录组证据、同源蛋白及从头模型,功能注释关联多数据库
  • 重复序列注释文件包:Sideroxylon_spinosum_repeat_annotation.zip
  • 包含GFF3格式的简单、复杂及组合重复注释文件
  • 包含软屏蔽基因组FASTA(重复序列小写标记)
  • 包含硬屏蔽基因组FASTA(重复序列替换为Ns)
  • 重复注释采用多轮策略,结合谱系特异性与从头重复库

数据来源

Zenodo

适用场景

  • 阿甘树功能基因组学研究:解析基因结构与功能元件分布
  • 比较基因组分析:与其他杜鹃花目物种的基因与重复序列特征对比
  • 分子标记开发:基于重复序列注释挖掘物种特异性遗传标记
  • 经济性状关联分析:结合基因注释探索油脂合成等关键性状的遗传基础
  • 生态适应性研究:通过基因组结构解析阿甘树的环境适应机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 584.45 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。