Hadza_Prevotella_Based基因组组装与CAZy预测完整研究数据2023

数据集概述

本数据集包含Gellman et al. 2023年研究中Hadza Prevotella的基因组组装、注释及CAZy(碳水化合物活性酶)预测结果,涉及相关菌株(如Pcopri、Btheta、Buniformis)的基因组支架、基因注释文件、CAZy酶分类数据及分析代码,共47个文件,用于支持饮食来源碳水化合物对肠道菌群定植影响的研究。

文件详解

  • 基因组支架文件(.fasta)
  • 文件名称:如Pcopri_2379_scaffolds.fasta、Btheta04_scaffolds.fasta等
  • 文件格式:FASTA
  • 字段映射介绍:包含Hadza Prevotella及相关菌株的基因组DNA序列片段(scaffolds)
  • 基因注释文件(.gff)
  • 文件名称:如BF1.gff、Pcopri_2489_02.gff、Buniformis.gff等
  • 文件格式:GFF
  • 字段映射介绍:记录基因组特征的位置与注释信息,包括基因、转录本等元件的坐标与属性
  • CAZy预测数据文件(.csv)
  • 文件名称:如2477_Pcopri.csv、western_4019_Pcopri.csv、BF1.csv等
  • 文件格式:CSV
  • 字段映射介绍:包含基因ID(如fig|6666666.653309.peg.63)与对应的CAZy家族分类(如PL9、GH57)
  • 分析代码文件(.Rmd)
  • 文件名称:RNAseq_code.Rmd、Figure4_code.Rmd、Figure3_code.Rmd
  • 文件格式:R Markdown
  • 字段映射介绍:用于RNA-seq分析及图表生成的代码脚本
  • 样本映射文件(.xlsx)
  • 文件名称:RNA_sample_map.xlsx、file_map.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:记录样本与数据文件的对应关系及文件目录映射信息

数据来源

论文“Genome assemblies for Hadza Prevotella Require Diet-derived Microbiota Accessible Carbohydrates to Persist in mice”

适用场景

  • 肠道微生物基因组学研究:分析Hadza Prevotella的基因组结构与功能特征
  • 碳水化合物活性酶分析:探究肠道菌群中CAZy家族的分布与代谢潜力
  • 饮食-菌群互作机制研究:结合基因组数据解析饮食来源碳水化合物对肠道菌群定植的影响
  • 微生物组代谢通路注释:基于基因组注释与CAZy数据构建碳水化合物代谢相关通路
  • 生物信息学方法复现:利用Rmd代码复现研究中的RNA-seq分析与可视化结果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 76.36 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。