数据集概述
本数据集包含对49株Arcobacter butzleri基因组的分析结果,涵盖基因组组装与注释、核心及泛基因组位点数据。数据支持研究该新兴人类病原体的毒力、抗生素耐药性可塑性及基因组多样性,包含组装序列、转录本序列、氨基酸序列、核心基因座比对、特定基因比对、PorA高变区分类序列及泛基因组等位基因谱矩阵等8个文件。
文件详解
- 注释组装文件包(Annotated_assemblies_gbk.zip)
- 文件格式:ZIP
- 内容:包含49株Arcobacter butzleri的基因组注释文件(.gbk格式)
- 基因组组装文件包(Genome_assemblies_fasta.zip)
- 文件格式:ZIP
- 内容:包含49株Arcobacter butzleri的基因组组装序列(.fasta格式)
- 转录本核苷酸序列文件包(Assemblies_nucleotide_sequences_ffn.zip)
- 文件格式:ZIP
- 内容:包含预测转录本(CDS、rRNA、tRNA、tmRNA、misc_RNA)的核苷酸序列(.ffn格式)
- 氨基酸序列文件包(Assemblies_amino_acid_sequences_faa.zip)
- 文件格式:ZIP
- 内容:包含翻译后的CDS氨基酸序列(.faa格式)
- 核心基因座比对文件包(Core_loci_alignments.zip)
- 文件格式:ZIP
- 内容:包含1165个核心基因组位点的核苷酸比对数据
- 特定基因比对文件包(Alignments_porA_hecA_and_tetR.zip)
- 文件格式:ZIP
- 内容:包含hecA、tetR、porA基因的核苷酸比对数据
- 泛基因组等位基因谱矩阵(A_butzleri_49_genomes_7474_loci_allelic_profile_matrix.xlsx)
- 文件格式:XLSX
- 内容:包含7474个泛基因组位点的等位基因谱矩阵
- 泛基因组首个等位基因序列(First_allele_all_7474_loci.fasta)
- 文件格式:FASTA
- 内容:包含7474个泛基因组位点每个位点的首个等位基因核苷酸序列
适用场景
- 病原体基因组多样性研究:分析Arcobacter butzleri的基因组结构变异与进化关系
- 毒力与耐药性机制研究:通过核心基因及特定基因(如tetR)分析耐药性相关基因的分布与变异
- 分子流行病学研究:利用等位基因谱矩阵追踪菌株的传播路径与流行特征
- 疫苗靶点筛选:通过PorA高变区序列分析潜在的抗原多样性,支持疫苗研发
- 泛基因组学分析:研究Arcobacter butzleri的核心基因与可变基因组成,揭示其适应环境的分子机制