Virosaurus病毒基因组参考序列数据集

数据集概述

该数据集是一个经过整理的病毒基因组参考数据库,旨在为临床宏基因组学分析提供支持。包含脊椎动物病毒、其他病毒(昆虫、真菌、真核微生物)和植物病毒的聚类、注释序列及完整基因组/片段序列,以FASTA格式存储,部分文件经压缩处理。

文件详解

该数据集包含八个文件,具体说明如下: - 压缩格式序列文件(.gz):共七个,按病毒类型和聚类阈值分类 - virosaurus90_vertebrate-20200330.fas.gz:脊椎动物病毒序列,90%聚类阈值 - virosaurus98_vertebrate-20200330.fas.gz:脊椎动物病毒序列,98%聚类阈值 - virosaurus90_plant-20200330.fas.gz:植物病毒序列,90%聚类阈值 - virosaurus98_plant-20200330.fas.gz:植物病毒序列,98%聚类阈值 - virosaurus90_others-20200330.fas.gz:其他病毒序列,90%聚类阈值 - virosaurus98_others-20200330.fas.gz:其他病毒序列,98%聚类阈值 - complete-genome-20200330.tar.gz:所有脊椎动物病毒科的完整基因组/片段序列 - 文档文件(.pdf): - Virosaurus_user_manual.pdf:用户手册,提供数据库使用说明

适用场景

  • 临床宏基因组学分析:用于病毒序列比对与鉴定
  • 病毒基因组研究:支持病毒分类、进化分析及多样性研究
  • 分子诊断开发:为病毒检测试剂盒设计提供参考序列
  • 生物信息学工具测试:验证病毒序列分析算法的准确性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 588.13 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。