数据集概述
本数据集为2022年发表于《Nature Ecology and Evolution》的研究配套数据,围绕碳水化合物复杂性对合成人类肠道菌群生长及扰动敏感性的影响展开。包含基因测序处理代码、分类学文件、数据库文件及图表数据,共13个文件,支持肠道微生物生态系统的相关分析。
文件详解
- 代码文件(.py格式,共7个)
- 包含文件:percent_indexed.py、percent_assembled.py、UW_filter_2019_02_01.py、unzip_PEAR.py、percent_filtered.py、UW_wang_cutoff60.py、GenerateTallyFile.py
- 功能:用于Illumina测序数据的索引统计、组装统计、过滤、解压、分类学处理等生物信息学分析步骤
- 数据文件(.xlsx格式,共4个)
- 包含文件:Comm10_minusDP_EL.xlsx、Figure1.xlsx、Figure2.xlsx、Figure4.xlsx
- 内容:肠道菌群群落数据及研究图表对应的原始数据
- 分类学文件(.txt格式)
- 文件名称:2019_06_18_NGS_based_taxonomy.txt
- 内容:记录微生物样本的分类学信息,包含样本ID与从界到种的分类层级映射(如AC_NGS_UW对应Bacteria;Firmicutes等层级)
- 数据库文件(.fa格式)
- 文件名称:2019_06_21_NGS_based_database.fa
- 内容:NGS测序分析所用的参考数据库文件
数据来源
论文“Carbohydrate complexity limits microbial growth and reduces the sensitivity of synthetic human gut communities to perturbations”(Nature Ecology and Evolution, 2022)
适用场景
- 肠道微生物生态研究:分析碳水化合物复杂性对肠道菌群生长限制及群落稳定性的作用机制
- 微生物扰动响应分析:探究合成肠道菌群对外部扰动的敏感性与碳水化合物结构的关联
- 生物信息学方法验证:利用配套代码复现Illumina测序数据的处理流程,验证肠道微生物分类学分析方法
- 肠道菌群代谢研究:通过群落数据探索碳水化合物代谢与菌群结构的相互关系