数据集概述
本数据集通过挖掘公共细菌和古菌基因组数据,识别出12,498个高置信度病毒基因组及其关联的微生物宿主。数据补充了现有公共数据集,提供13个新细菌门的首条病毒序列,助力解析病毒组中未知序列空间,包含病毒分类、基因组重组、原噬菌体及共感染等分析内容。
文件详解
- 文件名称:VirSorter_Curated_Dataset_genbank-files.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包包含整理后的GenBank格式病毒基因组文件,具体字段需解压后查看GenBank标准格式内容,可能涵盖病毒基因组序列、注释信息、宿主关联数据等(无预览情况下基于常见GenBank文件结构推断)
数据来源
论文“Viral dark matter and virus–host interactions resolved from publicly available microbial genomes”
适用场景
- 病毒生态学研究:分析病毒在微生物生态系统中的分布、多样性及生态功能
- 病毒分类学研究:基于基因组和网络分类识别新病毒属,完善病毒分类体系
- 病毒-宿主相互作用分析:探究病毒与微生物宿主的关联模式及共感染机制
- 病毒组未知序列解析:辅助识别和分类病毒组中的未知序列空间,提升病毒序列注释效率
- 原噬菌体研究:分析微生物基因组中的染色体外原噬菌体特征及分布规律