数据集概述
本数据集围绕锌抗病毒蛋白(ZAP)对感染脊椎动物RNA病毒基因组组成的影响展开,包含系统发育分析、蛋白结构、病毒组成等多维度数据,支撑研究ZAP起源进化及与病毒基因组CpG抑制的关联。
文件详解
该数据集包含多个目录及文件,具体说明如下:
- 病毒组成数据(Viral composition/ 目录):
- ssRNA_viruses_info.csv:CSV格式,包含病毒分类、宿主、基因组大小、碱基组成等字段,如TaxID(分类ID)、Species(物种)、GC.(GC含量)、Size..Kb.(基因组大小)
- ssRNA_viruses_bias.csv:CSV格式,包含病毒二核苷酸频率数据,字段如TaxID、AA(二核苷酸AA频率)、AC(二核苷酸AC频率)等
- 系统发育分析文件(Phylogenetic analyses/ 目录):
- Vert_PARP12-ZAP.90.fasta:FASTA格式,可能为PARP12-ZAP同源序列文件
- Vert_PARP12-ZAP.90.aln.fasta:FASTA格式,可能为PARP12-ZAP同源序列比对文件
- Vert_PARP12-ZAP.90.phylogeny.log:LOG格式,可能为系统发育分析日志文件
- Vert_PARP12-ZAP.90.constraint1.nwk:NWK格式,可能为系统发育树文件
- 蛋白结构文件(Protein structures/ 目录):
- 8个PDB格式文件,如PARP12_Hsapiens.pdb(人类PARP12蛋白结构)、ZAP_Rbivittatum.pdb(某种ZAP蛋白结构)等,记录不同物种PARP12和ZAP蛋白的三维结构数据
适用场景
- 病毒进化研究:分析RNA病毒基因组组成与宿主ZAP蛋白的共进化关系
- 分子生物学研究:探究ZAP蛋白结构功能及与病毒RNA结合的分子机制
- 系统发育分析:追溯ZAP蛋白在脊椎动物中的起源与演化历程
- 抗病毒机制研究:研究宿主ZAP介导的免疫压力对病毒基因组CpG抑制的影响