数据集概述
本数据集为气候变化多组学数据库(MUCC database)v2.0.0,包含OWC、PPR、JLA、LA2、Stordalen Mire、US-Twt及SPRUCE等湿地站点的扩增子、宏基因组和宏转录组测序数据,涉及1112个样本,含MAGs、基因序列、注释信息及相关分析文件,用于气候变化相关的多组学研究。
文件详解
- 16S.zip
- 文件格式:ZIP
- 内容:1112个样本的16S扩增子测序数据(fastq文件)及站点元数据
- MQ_HQ_MAGs.zip
- 文件格式:ZIP
- 内容:4745个中高质量宏基因组组装基因组(MAGs,fasta文件)
- MUCC_v2.0.0_HQMQ_genes.faa.zip
- 文件格式:ZIP
- 内容:基于DRAM基因预测的MAG氨基酸基因序列(fasta文件)
- MUCC_v2.0.0_HQMQ_annotations.tsv
- 文件格式:TSV
- 内容:MAG的DRAM注释信息
- owc_metat_table_methanoregula_genes.csv
- 文件格式:CSV
- 内容:133个宏转录组中Methanoregula属基因的表达量数据
- gtdbtk.ar53.decorated.tree
- 文件格式:Newick
- 内容:GTDB流程构建的Methanoregula MAG系统发育树
- Newick_gene_trees.zip
- 文件格式:ZIP
- 内容:用于甲基营养基因同源物blast鉴定的基因树文件
- fasta_reference_genes.zip
- 文件格式:ZIP
- 内容:用于blast查询的参考基因fasta文件(涉及ROS解毒及甲基化合物产甲烷代谢相关基因)
- protpipeliner.py
- 文件格式:Python脚本
- 内容:基于protpipeliner.rb修改的RAXML树构建脚本
- classification_w_outgroup.txt
- 文件格式:TXT
- 内容:系统发育树中Methanoregula的分类信息及对应MAG ID
- Methanoregula_metabolism_summary.xlsx
- 文件格式:XLSX
- 内容:MUCC、GTDB及JGI来源的Methanoregula MAGs的DRAM注释汇总
- Methanoregula_physiology.txt
- 文件格式:TXT
- 内容:Methanoregula MAGs的目标生理功能注释信息
- Methanoregula_MAGs_list.txt
- 文件格式:TXT
- 内容:所用Methanoregula MAGs的完整列表及来源数据库
- Methanoregula_MAGs_DB.zip
- 文件格式:ZIP
- 内容:108个Methanoregula MAGs数据库
数据来源
OWC、PPR、JLA、LA2数据:NCBI Bioproject PRJNA1007388;Stordalen Mire MAGs:BioProject PRJNA386538;US-Twt数据:SRA SRP003022等;SPRUCE数据:PRJNA638786、PRJNA638601
适用场景
- 湿地微生物群落结构分析: 利用16S扩增子数据研究气候变化对湿地微生物群落的影响
- 宏基因组功能注释研究: 通过MAGs及DRAM注释分析湿地微生物的代谢功能
- 甲烷代谢微生物研究: 基于Methanoregula属的基因表达及注释数据,探究其在气候变化中的作用
- 系统发育分析: 利用Newick树文件开展微生物类群的进化关系研究
- 环境胁迫响应机制研究: 通过ROS解毒相关基因数据,分析微生物对环境胁迫的响应策略