数据集概述
本数据集为论文“Resurrecting Ancient Antibiotics: Unveiling the Origins of Modern Lipid II Targeting Glycopeptides”的支持数据,包含49个文件,涉及系统发育树、序列比对、进化重建概率等内容,用于揭示现代脂肽类抗生素的进化起源与机制。
文件详解
- 系统发育树文件(.newick格式,21个)
- 示例文件:NRPS_tree_outgroup_bootstraps.newick、Bhp_Bht_cassette.newick等
- 内容:存储不同基因或蛋白家族的系统发育树结构,包含分支关系与 bootstrap 支持值
- 序列文件(.fasta/.fas格式,12个)
- 示例文件:N16.fasta、sequences_of_the_marginal_reconstruction_without_reconstruction_of_indels.fas等
- 内容:基因或蛋白序列数据,包括比对后序列、进化重建序列等
- 进化概率文件(.xlsx格式,5个)
- 示例文件:probabilities_Mod_1-2.xlsx、probabilities_Mod_7.xlsx等
- 内容:存储祖先序列重建(ASR)的概率数据,按不同模型分组
- 文本文件(.txt格式,6个)
- 示例文件:Tree_in_Ancestor_format.txt、ASRguideTree.txt等
- 内容:系统发育树的辅助说明、祖先格式树结构、引导树信息等
- 其他文件
- 图像文件:Tanglegram_with_names.bmp(系统发育树缠结图)
- 脚本文件:pal2nal.pl(序列比对转换脚本)
- 树文件:autoMLST_tree_GPA_producers.tree(MLST系统发育树)
数据来源
论文“Resurrecting Ancient Antibiotics: Unveiling the Origins of Modern Lipid II Targeting Glycopeptides”
适用场景
- 抗生素进化研究:分析脂肽类抗生素的起源与进化路径
- 系统发育分析:利用.newick树文件研究相关基因/蛋白家族的亲缘关系
- 祖先序列重建:基于概率数据与序列文件开展抗生素合成相关基因的祖先状态推断
- 生物信息学方法验证:评估不同模型在抗生素进化分析中的应用效果
- 药物研发支撑:为新型脂肽类抗生素的设计提供进化机制参考