发酵食品微生物分离株功能注释与生物合成基因簇预测数据集

数据集概述

本数据集包含从BacDive数据库获取的约250株发酵食品来源细菌分离株基因组的分析结果,涵盖KEGG功能注释、生物合成基因簇(BGCs)预测及小ORF(smORFs)与切割肽两类肽段预测数据,为研究发酵食品微生物功能提供支持。

文件详解

  • curated_bacdive_genomes.tar.gz:压缩归档文件,包含约250株BacDive细菌基因组的FASTA序列文件,来源于NCBI
  • 2024-12-06-bacdive-accessions-curated-metadata.tsv:TSV格式元数据文件,包含基因组的GenBank登录号、分离源、完整性、污染率等信息
  • all_molecule_counts.tsv:TSV格式汇总文件,统计每个基因组的BGCs、smORFs、切割肽等分子类型数量
  • combined_kofamscan_results.tsv:TSV格式文件,包含所有基因组的Kofam KEGG HMM功能注释结果
  • all_smorfinder_results.tsv:TSV格式文件,包含smorfinder预测的所有smORFs结果
  • all_deeppeptide_results.tsv:TSV格式文件,包含DeepPeptide预测的所有切割肽结果,字段包括peptide_id、start、end、peptide_type、genome_name等
  • 2025-02-24-bacdive-antismash-predictions.zip:压缩归档文件,包含每个基因组的antiSMASH预测结果,解压后按基因组分目录,每个目录含json摘要、log日志及GBK格式BGC文件

适用场景

  • 发酵食品微生物功能基因组学研究
  • 生物合成基因簇(BGCs)挖掘与次级代谢产物分析
  • 微生物肽段(smORFs、切割肽)功能预测与应用研究
  • 食品发酵过程微生物代谢通路解析
  • 发酵食品微生物资源开发与利用研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 644.75 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。