数据集概述
本数据集包含BeONE Consortium收集的308株大肠杆菌样本的基因组组装数据,以及来自ENA或NCBI SRA的1999株大肠杆菌公开基因组组装补充数据。数据经标准化处理,包含组装统计信息、基因分型及样本元数据,支持大肠杆菌的基因组学研究与分析。
文件详解
- BeONE_Ec_metadata.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含各菌株的基因组组装统计信息,如欧洲核苷酸档案登录号、计算机多基因座序列分型(MLST)、血清型,以及采样年份、国家和来源等元数据。
- BeONE_Ec_assemblies.zip
- 文件格式:ZIP
- 内容说明:压缩包内包含元数据文件中所有菌株的基因组组装序列,格式为.fasta。
数据来源
One Health European Joint Programme “BeONE: Building Integrative Tools for One Health Surveillance”项目,原始数据来自欧洲核苷酸档案(ENA)BioProject登录号PRJEB57098及公开数据库ENA、NCBI SRA。
适用场景
- 大肠杆菌基因组多样性研究:分析不同来源大肠杆菌的基因组特征与遗传变异。
- 微生物监测与溯源:利用MLST和血清型数据开展大肠杆菌的流行病学监测与菌株溯源。
- 基因组组装方法评估:基于标准化组装数据,比较不同基因组组装工具的性能。
- 公共卫生研究:结合采样元数据,研究大肠杆菌在不同地区和来源中的分布规律。