GBRAP_Based_古菌与细菌基因组特征机器学习分类数据集

数据集概述

本数据集用于古菌与细菌的机器学习分类分析,包含通过GBRAP工具计算的77个基因组特征。数据支持识别新型预测性基因组特征,为微生物分类研究提供结构化的基因组特征数据基础。

文件详解

  • 文件名称:dataset_archaea_bacteria.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含用于古菌与细菌分类分析的77个基因组特征字段,特征由GBRAP(GenBank Retrieving, Analyzing and Parsing)工具计算生成,具体字段对应基因组序列的检索、解析及分析结果。

数据来源

论文“Machine learning classification of archaea and bacteria identifies novel predictive genomic features”及GBRAP工具(Vischioni, C. et al. Gbrap: a tool to retrieve, parse and analyze genbank files of viral and bacterial species. bioRxiv 2021–09 (2021))

适用场景

  • 微生物分类模型构建: 利用基因组特征数据训练机器学习模型,实现古菌与细菌的自动分类。
  • 基因组特征挖掘: 识别可用于微生物分类的新型预测性基因组特征,探索特征与分类的关联机制。
  • 微生物基因组分析工具验证: 评估GBRAP工具计算的基因组特征在分类任务中的有效性。
  • 微生物学基础研究: 为古菌与细菌的系统发育、进化关系研究提供基因组特征数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.39 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。