数据集概述
本数据集包含用于丁香假单胞菌(Pseudomonas syringae)分类和毒力因子预测的16个文件,涵盖核心基因组树、分类元数据、QIIME 2分类器及毒力因子分析结果,可支持该菌种的分类鉴定、毒力因子检测及相关生物信息学研究。
文件详解
- 核心基因组树文件
- 文件名称:PSSC.tree.txt
- 文件格式:TXT
- 字段映射介绍:包含2161个高质量丁香假单胞菌基因组的核心基因组树结构信息
- 元数据文件
- 文件名称:metadata.csv
- 文件格式:CSV
- 字段映射介绍:涵盖分类数据、模式菌株指定、系统发育群、LIN聚类、关键毒力因子有无及每个基因组Biosample记录中的元数据
- 分类器文件
- 文件名称:CLASSIFIER_xxx.qza(如CLASSFIER_CTS_Hwang.qza)
- 文件格式:QZA
- 字段映射介绍:基于文件名中指定引物组生成的扩增子训练的QIIME 2分类器工件
- 毒力因子分析结果文件
- 文件名称:GENOME_VFOC.json、PROTEIN_VFOC.json
- 文件格式:JSON
- 字段映射介绍:T3SS、效应因子及WHOP基因的HMMER分析结果,分别以基因组和基因产物登录号为主键
- 序列文件
- 文件名称:gapA_Hwang.fasta、CTS_Hwang.fasta等
- 文件格式:FASTA
- 字段映射介绍:包含不同基因(如gapA、gyrB、pgi、rpoD)的核苷酸序列
- 分类学文件
- 文件名称:LIN_taxonomy.tsv
- 文件格式:TSV
- 字段映射介绍:包含LIN分类系统的分类学数据
适用场景
- 微生物分类研究:利用核心基因组树和分类器进行丁香假单胞菌的精准分类与鉴定
- 毒力因子分析:通过HMMER结果文件研究丁香假单胞菌毒力因子的分布及特征
- 基因组学研究:基于元数据和序列文件开展该菌种的基因组特征及进化分析
- 分子诊断工具开发:利用QIIME 2分类器工件开发针对丁香假单胞菌的分子检测方法
- 公共卫生监测:通过毒力因子数据评估菌株的致病性及潜在风险