数据集概述
本数据集为基于Arbitrator 2023构建的nifD基因数据库(版本1.1.0),遵循nifH数据库的构建原则与方法,用于DADA2分析流程。包含基因序列、分类信息等多格式文件,支持微生物固氮相关研究,共6个文件。
文件详解
- Readme.txt
- 文件格式:TXT
- 字段映射介绍:包含引用信息、数据库构建方法说明及参考文献
- nifD_DB_phylum_v1.1.0.csv
- 文件格式:CSV
- 字段映射介绍:包含num(序号)、sequence(基因序列)、seqlen(序列长度)、tax(分类信息)、Accession(登录号)字段
- nifD_DB_phylum_v1.1.0.ods
- 文件格式:ODS
- 字段映射介绍:与nifD_DB_phylum_v1.1.0.csv内容一致的电子表格文件
- nifD_DB_phylum_v1.1.0.xlsx
- 文件格式:XLSX
- 字段映射介绍:与nifD_DB_phylum_v1.1.0.csv内容一致的电子表格文件
- nifD_v1.1.0.xml
- 文件格式:XML
- 字段映射介绍:nifD ARB数据库导出并更新NCBI分类信息后的XML元数据文件
- nifD_dada2_v1.1.0.fasta
- 文件格式:FASTA
- 字段映射介绍:nifD基因序列的FASTA格式文件,适用于DADA2分析流程
数据来源
nifDdada2 GitHub repository
适用场景
- 微生物分子生态学研究:分析环境样本中固氮微生物的群落组成与多样性
- 基因序列注释:利用nifD数据库对测序数据中的固氮酶基因进行分类注释
- 生物信息学分析流程开发:为DADA2等扩增子分析流程提供标准化的nifD基因参考数据库
- 固氮微生物进化研究:基于nifD基因序列的系统发育分析与分类学研究
- 环境微生物监测:通过nifD基因标记评估不同生态系统中固氮功能微生物的分布特征