数据集概述
本数据集包含111个宏基因组组装基因组(MAGs)的序列及相关信息,样本来源为抗生素预防下奶牛新鲜粪便、两个有机农场牧场土壤及施肥土壤构建的微宇宙。数据支持微生物组分类、功能及生态关联研究。
文件详解
- 文件名称: MAGs_FASTA_files.zip
- 文件格式: ZIP压缩包
- 内容: 包含所有宏基因组组装基因组的FASTA序列文件
- 文件名称: MAGs_data.xlsx
- 文件格式: Excel表格
- 字段说明:
- MAG名称、来源(粪便/土壤/施肥土壤)及实验分组、原始样本名
- 组装类型、分箱方法、MAG文件名
- GTDB-Tk预测的分类学归属(含最佳匹配分类及ANI值)
- 质量指标(完整性、污染率)、rRNA基因检测结果、tRNA氨基酸类型
- 覆盖度、平均/最大映射 reads 占比、组装统计量(GC含量、N50、基因组大小等)
- NCBI数据库访问信息、16S rRNA鉴定及序列
数据来源
NCBI BioProject PRJNA1231077
适用场景
- 微生物生态学研究: 分析不同环境样本中微生物群落结构差异
- 抗生素抗性研究: 探究奶牛粪便抗生素暴露对土壤微生物组的影响
- 微生物分类学: 基于MAGs数据进行未培养微生物的分类鉴定
- 基因组学分析: 研究微生物功能基因分布与环境适应性关联
- 数据挖掘应用: 整合多组学数据构建微生物生态互作网络