数据集概述
本数据集为挪威云杉(Picea abies)针叶转录组测序结果,包含约7000万条76bp片段的原始数据(5Gbp),通过从头组装及整合公共EST数据构建参考转录组,获得38419条长度超150bp的PUTs(推定唯一转录本),并分析了基因表达差异、SNPs及同义/非同义替换率,为裸子植物与被子植物的基因进化研究提供数据支持。
文件详解
- README_for_PAML_tables.txt
- 文件格式:TXT
- 字段映射介绍:包含PAML分析相关字段说明,如SEQ1(文件名中第一个物种)、SEQ2(第二个物种)、Code(ORF完整性标识)、Start/End(ORF氨基酸位置)、PAML_length(比对序列长度)等。
- pa_tgicl95_151.fa
- 文件格式:FA
- 字段映射介绍:挪威云杉针叶转录组的参考序列文件,包含组装得到的PUTs序列信息。
- PAML_tables.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含用于PAML分析的表格文件,记录物种间序列比对及替换率计算相关数据。
- snp_filterQ60AF25.txt
- 文件格式:TXT
- 字段映射介绍:包含高质量SNPs信息,字段有Contig(contig编号)、POS(位置)、Ref(参考碱基)、ALT(替代碱基)等。
数据来源
论文“Sequencing of the needle transcriptome from Norway spruce (Picea abies Karst L.) reveals lower substitution rates, but similar selective constraints in gymnosperms and angiosperms”
适用场景
- 植物转录组进化研究:分析裸子植物与被子植物的同义/非同义替换率差异及选择压力。
- 基因表达调控分析:探究挪威云杉针叶在黑暗与光照条件下的基因表达差异。
- 分子标记开发:利用高质量SNPs数据开发挪威云杉的分子遗传标记。
- 裸子植物功能基因组学:通过PUTs注释及ORF预测研究挪威云杉基因功能及编码特征。