数据集概述
本数据集为PanRes抗菌耐药基因数据库,整合了ResFinder、CARD等多个已发表的抗菌耐药基因(ARGs)集合,形成统一的基因库。包含基因序列文件及注释表,提供基因的来源数据库、聚类信息等元数据,适用于宏基因组中耐药基因的大规模筛查与分析。
文件详解
- README.md
- 文件格式:MD
- 字段映射介绍:包含数据库版本(v1.0.2)、创建方法(基于gene_assimilator工具)、注释文件说明等文档信息
- panres_genes.fa
- 文件格式:FA
- 字段映射介绍:PanRes数据库的抗菌耐药基因序列文件,每条序列具有唯一"pan_"标识符
- panres_annotations.xlsx
- 文件格式:XLSX
- 字段映射介绍:抗菌耐药基因的元数据注释表,包含基因来源数据库、聚类信息等宽格式与长格式注释内容
- panres_annotations.tsv
- 文件格式:TSV
- 字段映射介绍:以三列(gene、variable、value)存储的基因注释数据,包含基因ID(如pan_1_v1.0.2)、注释变量及对应值(如fa_header对应的基因来源与功能信息)
数据来源
ARGfinder pipeline相关研究(Unpublished, submitted)
适用场景
- 宏基因组耐药基因筛查: 用于大规模分析公共宏基因组数据中的抗菌耐药基因及其侧翼区域
- 耐药基因数据库整合研究: 对比不同来源抗菌耐药基因集合的特征与重叠性
- 耐药基因进化分析: 基于基因聚类信息研究抗菌耐药基因的进化关系与传播机制
- 临床微生物耐药监测: 辅助临床样本中耐药基因的快速识别与分型
- 抗菌药物研发支撑: 为新型抗菌药物的靶点设计提供耐药基因序列与功能信息参考