鲍曼不动杆菌防御系统与原噬菌体关联分析数据集

数据集概述

本数据集围绕鲍曼不动杆菌防御系统展开分析,探究其与原噬菌体分布的关联,运用机器学习技术关联防御系统与原噬菌体的正负相关性,包含相关Python分析脚本及处理流程,为研究防御系统替换与原噬菌体分布的进化关系提供技术支持。

文件详解

  • 核心文件:
  • aba_defensome.zip: 压缩文件,包含所有分析脚本与数据处理文件
  • Python脚本文件(.py格式):
  • binary_matrix.py: 生成防御系统二进制矩阵,用于Upset图输入
  • coocurr_matrix.py: 生成防御系统共现矩阵,用于图2A输入
  • defsys_pres_ann.py: 创建防御系统有无矩阵
  • freq_phages_bymlst.py: 获取MLST分组中高频原噬菌体(占基因组10%)
  • matrix_mlst_phages_freq.py: 生成原噬菌体按MLST分组的绝对/相对频率矩阵
  • pres_aus_matrix_cl.py: 创建原噬菌体有无矩阵
  • matrix_preaus_ml.py: 为原噬菌体有无矩阵添加防御系统及MLST分组列
  • cdhit_heamtap.py: 读取CD-HIT输出构建变异矩阵
  • triangle_to_square.py: 将三角矩阵转换为方阵
  • merge_dist.py: 合并系统发育距离与Kimura距离并确定MLST关系
  • 环境配置:
  • 依赖包版本: numpy 1.26.4、pandas 2.2.2

适用场景

  • 微生物进化研究: 分析防御系统替换与原噬菌体分布的进化关联
  • 细菌防御机制研究: 探究防御系统与原噬菌体的互作关系
  • 生物信息学方法应用: 复现防御系统与原噬菌体关联分析流程
  • 机器学习在微生物学中的应用: 基于防御系统数据预测原噬菌体分布
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 9.4 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。