数据集概述
本数据集提供柚木(Tectona grandis)染色体级高质量基因组组装及功能注释数据,包含基因序列、表达矩阵、基因组注释文件等,支持研究柚木串联基因复制机制及天然产物生物合成通路相关基因的发现,助力柚木品种改良与可持续生产研究。
文件详解
- 文档类文件
- 文件名称:2018.10.23-teak-data-readme.docx
- 文件格式:DOCX
- 字段映射介绍:数据集说明文档,提供数据背景、文件内容及使用指引
- 序列类文件(.fa格式,共10个)
- 代表性文件:teak_tectona_grandis_26Jun2018_7GlFM_fmt_tp.fa(基因组序列)、teak_hc_models_HiC.cdna_con_sorted_modiGeneID.fa(cDNA序列)、teak_hc_models_HiC.cds_con_sorted_modiGeneID.fa(CDS序列)、teak_hc_models_HiC.pep_con_sorted_modiGeneID.fa(蛋白序列)
- 文件格式:FA
- 字段映射介绍:包含柚木基因组、转录本、编码序列及蛋白质序列信息,部分文件带有修正后的基因ID
- 注释类文件(.gff格式,共3个)
- 代表性文件:teak_hc_models_HiC_con_sorted_modiGeneID.gff、teak.working_models_HiC_fmtDes_con_sorted.gff
- 文件格式:GFF
- 字段映射介绍:基因组特征注释文件,记录基因、转录本等元件在基因组上的位置及属性
- 表达数据文件
- 文件名称:teak_working_gene_fpkm_matrix_con_sorted.txt
- 文件格式:TXT
- 字段映射介绍:基因表达FPKM矩阵,包含不同组织(12年生枝条、60年生枝条、花、叶、根、幼苗、12年生茎等)的基因表达量数据,字段含Gene_ID及各组织样本ID
数据来源
论文“A chromosomal-scale genome assembly of Tectona grandis reveals the importance of tandem gene duplication and enables discovery of genes in natural product biosynthetic pathways”
适用场景
- 植物基因组学研究:分析柚木染色体级基因组结构、串联基因复制机制及基因功能注释
- 天然产物生物合成研究:挖掘萜类合成酶(TPS)等天然产物生物合成通路相关基因
- 柚木品种改良:筛选与生长性能、抗虫性相关的候选基因,助力柚木克隆繁殖品种选育
- 基因表达分析:基于FPKM矩阵研究柚木不同组织中基因的表达模式,尤其是木质组织中TPS基因的表达特征
- 酶功能验证:支持柚木TPS基因的酶活性实验及功能验证研究