数据集概述
本数据集为论文“Predicting antimicrobial resistance in Pseudomonas aeruginosa with machine learning-enabled molecular diagnostics”配套数据,包含铜绿假单胞菌菌株的耐药表型数据及基因表达、基因存在/缺失、单核苷酸多态性(SNPs)等分子特征数据,支持抗菌药物耐药性的机器学习预测研究。
文件详解
- Metadata.zip
- phenotypes.txt:表格文件,记录基于CLSI指南的二元耐药表型数据,行代表菌株,列对应不同药物;字段取值说明:耐药=1、敏感=0、缺失=中介耐药
- Features_gpa_exp_snps.zip
- genexp(基因表达表目录)
- genexp_feature_vect.npz:Numpy压缩格式的特征矩阵
- genexp_feature_list.txt:特征矩阵的列标签(特征)
- genexp_strains_list.txt:特征矩阵的行标签(菌株)
- gpa(基因存在/缺失表目录)
- gpa_feature_vect.npz:Numpy压缩格式的特征矩阵
- gpa_feature_list.txt:特征矩阵的列标签(特征)
- gpa_strains_list.txt:特征矩阵的行标签(菌株)
- snps(SNPs表目录)
- snps_feature_vect.npz:Numpy压缩格式的特征矩阵
- snps_feature_list.txt:特征矩阵的列标签(特征)
- snps_strains_list.txt:特征矩阵的行标签(菌株)
- REAME.md:说明文档(未提供预览内容)
适用场景
- 微生物耐药性研究:分析铜绿假单胞菌对不同抗菌药物的耐药机制
- 机器学习模型构建:基于分子特征预测细菌耐药表型的算法开发
- 分子诊断应用:探索抗菌药物耐药性快速检测的分子标记物
- 临床药学研究:为抗菌药物合理使用及耐药防控提供数据支持