数据集概述
本数据集包含27株海洋蓝细菌Prochlorococcus的全基因组序列(2株完整闭合,25株草稿质量),覆盖5个主要系统发育分支,分离自全球不同海域。同时提供预计算的蛋白质直系同源组(COGs)聚类数据,可用于比较基因组学研究,是微生物生态学、进化和海洋学领域的重要参考资料。
文件详解
- 文档文件(document_files)
- 文件名称:README_for_Prochlorococcus_COGS_annotations.txt
- 文件格式:TXT
- 字段映射介绍:包含测序菌株基因的聚类分配及注释元数据,由RAST管道提供注释,列定义包括Genome(菌株)、Gene ID(基因唯一ID)、NCBI ID、CyCOG版本(V1/V3/V4)、RAST注释、GO注释、Argot2注释等。
- 文件名称:README_for_detailed_Prochlorococcus_genome_annotations.txt
- 文件格式:TXT
- 字段映射介绍:提供基因组详细注释的说明文档
- 文件名称:Prochlorococcus_COGS_annotations.txt
- 文件格式:TXT(制表符分隔)
- 字段映射介绍:包含Genome、Gene ID、NCBI ID、V1 CyCOG、V3 CyCOG、V4 CyCOG、RAST annotation、GO annotation、Argot2 annotation等字段的基因注释数据
- 压缩文件(archive_files)
- 文件名称:all_Prochlorococcus_ORFs_faa.zip
- 文件格式:ZIP
- 内容说明:包含所有Prochlorococcus开放阅读框(ORFs)的氨基酸序列文件
- 文件名称:all_Prochlorococcus_ORFs_fna.zip
- 文件格式:ZIP
- 内容说明:包含所有Prochlorococcus开放阅读框(ORFs)的核苷酸序列文件
- 文件名称:detailed_Prochlorococcus_genome_annotations.zip
- 文件格式:ZIP
- 内容说明:包含基因组详细注释数据的压缩包
- 文件名称:Prochlorococcus_cultures_complete_contig_sets.zip
- 文件格式:ZIP
- 内容说明:包含培养菌株完整contig集合的压缩包
- 文件名称:Prochlorococcus_genome_sequences.zip
- 文件格式:ZIP
- 内容说明:包含基因组序列数据的压缩包
适用场景
- 微生物基因组比较分析: 利用27株不同分支Prochlorococcus的基因组序列,研究物种内遗传多样性与系统发育关系。
- 海洋微生物生态学研究: 结合分离海域信息,分析Prochlorococcus的地理分布驱动因素及生态适应性机制。
- 功能基因组学研究: 通过COGs聚类数据,探究基因功能分布特征及核心基因与特有基因的演化规律。
- 海洋蓝细菌进化研究: 基于基因组序列差异,解析Prochlorococcus在寡营养海洋环境中的进化历程与适应策略。
- 海洋生态系统功能分析: 以Prochlorococcus为模式生物,研究其在海洋碳循环及初级生产力中的作用机制。