数据集概述
本数据集包含5株非结核分枝杆菌(NTM)菌株的基因组组装与注释数据,涉及参考菌株及临床菌株,覆盖基因组拼接序列、转录本核苷酸序列、CDS氨基酸序列等多类文件,总计25个文件,用于研究NTM在肺泡巨噬细胞模拟细胞模型中的持留机制。
文件详解
- 基因组组装与注释文件(.gbk、.fasta)
- 文件名称:如Ma_6008.gbk、Mf_6841.fasta等
- 文件格式:GBK、FASTA
- 字段映射介绍:GBK文件包含菌株基因组的组装contigs及注释信息;FASTA文件为基因组拼接的核苷酸序列
- 转录本序列文件(.ffn)
- 文件名称:如Mf_6841.ffn等
- 文件格式:FFN
- 字段映射介绍:包含预测转录本(CDS、rRNA、tRNA等)的核苷酸序列
- 氨基酸序列文件(.faa)
- 文件名称:如Ms_mc2_155.faa等
- 文件格式:FAA
- 字段映射介绍:包含翻译后的CDS氨基酸序列
- CDS列表文件(.xlsx)
- 文件名称:如Mf_74708_CDS_list.xlsx等
- 文件格式:XLSX
- 字段映射介绍:记录菌株的CDS列表信息
数据来源
欧洲核苷酸档案库(ENA)BioProject PRJEB30455;相关文章:https://www.ncbi.nlm.nih.gov/pubmed/31035520
适用场景
- 非结核分枝杆菌基因组结构分析: 利用组装序列与注释文件研究NTM菌株的基因组特征
- 微生物基因功能研究: 通过CDS列表、氨基酸序列分析NTM的基因功能及编码蛋白特性
- 持留机制分子基础探究: 结合细胞模型背景,分析NTM持留相关的基因组差异
- 临床菌株与参考菌株比较研究: 对比临床菌株与参考菌株的基因组数据,挖掘耐药或毒力相关基因
- 转录组及蛋白质组关联分析: 利用转录本核苷酸序列与氨基酸序列,支撑多组学联合研究