数据集概述
该数据集是古菌组抗生素发现深度学习研究的补充数据,包含古菌素序列、活性预测结果、氨基酸百分比统计检验表、GO频率及分析证书等6个文件,支持古菌来源抗生素的挖掘与验证研究。
文件详解
- 文件名称及格式:
- Supplementary_Data_1_List_of_12632_archaeasin_sequences_found_by_APEX_with_predicted_MICs.csv:CSV格式,含APEX工具发现的12632条古菌素序列及预测最低抑菌浓度(MICs)字段
- Supplementary_Data_2_Archaeasins_predicted_active_with_source_organisms.csv:CSV格式,含预测有活性的古菌素及对应来源生物体,列包含多种致病菌(如A. baumannii、E. coli等)
- Supplementary_Data_3_AA_percentage_mannwhitneyu_oneside_greater_pval_table.csv:CSV格式,氨基酸百分比单样本曼-惠特尼U检验(单侧大于)p值表,列含古菌组与人类蛋白质组等比较维度
- Supplementary_Data_4_AA_percentage_mannwhitneyu_oneside_less_pval_table.csv:CSV格式,氨基酸百分比单样本曼-惠特尼U检验(单侧小于)p值表
- Active_Archaea_EP_GO_frequency.tsv:TSV格式,活性古菌表达产物的基因本体(GO)频率数据
- COA_archaeasins.zip:ZIP格式,古菌素分析证书压缩文件
适用场景
- 微生物药物研发:挖掘古菌来源的新型抗生素候选分子
- 生物信息学分析:验证深度学习模型在抗生素序列预测中的应用效果
- 微生物组学研究:分析古菌组与抗生素活性相关的分子特征
- 统计检验应用:基于氨基酸百分比数据开展组间差异比较研究