数据集概述
本数据集包含热带城乡交错带小型哺乳动物的宿主-微生物组关联研究数据,涵盖16Sv4 rRNA基因测序数据、生物信息学分析脚本、样本元数据及统计分析文件,为探究宿主物种、环境因素与微生物组的关系提供支持。
文件详解
该数据集由测序数据清单、生物信息学文件、统计分析数据及脚本组成,具体说明如下:
- 测序数据清单文件:
- file_checklist_project_PRJEB81284.tsv: TSV格式,包含245个样本的ENA项目信息(样本ID、研究ID)、测序参数(仪器型号、文库信息)及测序文件(正反向读段文件名与MD5值)
- 生物信息学文件:
- script_qiime2_Borneo_sm_microbiota.sh: SH格式,用于通过QIIME 2分析16Sv4序列生成扩增子序列变体(ASVs)的Bash脚本
- metadata_qiime2_Borneo_sm_microbiota: 无格式,运行上述脚本所需的元数据,含样本ID、个体ID、物种、捕获地点、UTM坐标、性别及年龄
- 统计分析数据文件(R_data_Borneo_sm_microbiota.zip):
- dataset_samples.csv: CSV格式,245个小型哺乳动物粪便样本的个体信息,含样本ID、物种、捕获地点、UTM坐标、性别、年龄等9个字段
- dataset_environment.csv: CSV格式,3541个捕获地点的环境与物种存在数据,含土地覆盖类型、4个物种的存在-缺失信息等20个字段
- dataset_asv.txt: 文本格式,245个样本的ASV丰度表,含6109个ASV及对应序列数
- dataset_taxonomy.tsv: TSV格式,ASV的分类信息,含ASV编码、分类地位(域到种)及置信度
- ASV_phylogenetic_tree.nwk: NWK格式,ASV的系统发育树
- host_species_trees.nex: NEX格式,小型哺乳动物物种的系统发育树(来自vertlife.org)
- ANCOMBC_palette_families.csv: CSV格式,ANCOMBC结果图(图5)的颜色 palette
- legend_bacterial_families.rds: RDS格式,微生物组组成图的细菌科颜色图例
- 统计分析脚本文件(R_scripts_Borneo_sm_microbiota.zip):
- 含10个R脚本,对应数据预处理、相对出现概率计算、微生物组组成分析、α/β多样性分析、ANCOM-BC差异丰度分析等步骤,可生成研究中的5幅核心图表
适用场景
- 宿主-微生物组研究: 分析小型哺乳动物物种、环境因素对肠道微生物组组成的影响
- 入侵生物学研究: 比较本地与入侵物种的微生物组差异及对环境的适应性
- 环境生态学研究: 探究土地利用强度对小型哺乳动物分布及微生物组的作用
- 生物信息学方法应用: 验证QIIME 2分析流程及微生物组统计方法(如GDM、ANCOM-BC)的有效性
- 空间生态学分析: 结合UTM坐标研究小型哺乳动物分布的空间格局与微生物组关联性