数据集概述
本数据集包含ICTV批准的双生病毒RefSeq物种样本的外壳蛋白(CP)、修剪后的复制相关蛋白(Rep)氨基酸序列比对结果、系统发育分析文件及关联元数据,共涉及432个符合纳入标准的物种样本,为双生病毒的分类与进化研究提供结构化数据支持。
文件详解
- 文件名称:
Begomovirus-ICTV-approved-species-exemplar-metadata_v3.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含445个ICTV批准物种样本的元数据,如分离国家、地理区域(AAEO/美洲)、基因组分段类型、V2/AV2基因存在情况、基因组/DNA-A片段长度等,未纳入分析的样本以红色标注。
- 文件名称:
Begomovirus-RefSeq-CP-aa-alignment-n432-v2.fasta
- 文件格式:FASTA
- 字段映射介绍:432个双生病毒物种样本的CP氨基酸序列比对结果。
- 文件名称:
Begomovirus-RefSeq-trimmed-Rep-aa-alignment-n432-v2.fasta
- 文件格式:FASTA
- 字段映射介绍:432个双生病毒物种样本修剪后的Rep氨基酸序列比对结果(保留功能区域)。
- 文件名称:
Begomovirus-RefSeq-CP-aa-alignment-n432-midpoint-rooted-contree-v2.nex
- 文件格式:NEXUS
- 字段映射介绍:CP氨基酸序列的中点根化最大似然系统发育树,分支按地理分组着色(美洲为橙色,AAEO区域为蓝色)。
- 文件名称:
Begomovirus-RefSeq-trimmed-Rep-aa-alignment-n432-midpoint-rooted-contree-v2.nex
- 文件格式:NEXUS
- 字段映射介绍:修剪后Rep氨基酸序列的中点根化最大似然系统发育树,分支按地理分组着色。
数据来源
ICTV病毒元数据资源(VMR #18, 2021-10-19)
适用场景
- 双生病毒分类学研究:利用CP与Rep序列比对及系统发育树分析病毒物种的分类关系与进化分支。
- 病毒进化分析:通过地理分组的系统发育树探究双生病毒的地域传播与进化路径。
- 病毒蛋白功能研究:基于CP与Rep氨基酸序列比对结果分析蛋白保守区域与功能位点。
- 病毒基因组特征分析:结合元数据中的基因组分段类型、基因存在情况等信息,研究双生病毒的基因组结构多样性。
- 病毒数据库补充:为病毒序列数据库提供标准化的双生病毒RefSeq物种样本数据与注释信息。