数据集概述
本数据集围绕大猩猩单纯疱疹病毒的系统发育分析展开,包含新型疱疹病毒的基因序列、系统发育树及相关元数据文件。数据源自野生大猩猩、倭黑猩猩和黑猩猩粪便样本的大规模筛查,旨在揭示人类单纯疱疹病毒的起源及跨物种传播机制,为理解人兽共患病起源提供支持。
文件详解
- 基因序列文件
- 文件名称:gorillasimplexvirus_74t_43797nt.fa
- 文件格式:FASTA
- 字段映射介绍:包含74个分类群、长度为43797nt的基因序列比对数据,涵盖部分基因组及基因片段序列
- 系统发育树文件
- 文件名称:gorillasimplexvirus_74t_43797nt.ML.tree
- 文件格式:TREE
- 字段映射介绍:基于FASTA文件通过IQTREE2构建的最大似然(ML)树,节点标签包含UF Bootstrap支持值
- 元数据文件
- 文件名称:Perelman_WideStDev_GSS_75_250K_WP.xml、SpringerC_WideStDev_GSS_75_250K_WP.xml、Fabre_WideStDev_GSS_75_250K_WP.xml
- 文件格式:XML
- 字段映射介绍:共3个XML格式的元数据文件,记录系统发育分析相关的实验参数与样本信息
- 说明文档
- 文件名称:README.txt
- 文件格式:TXT
- 字段映射介绍:包含数据 deposition 说明、通讯作者信息及各文件内容描述
数据来源
UCSD(加州大学圣地亚哥分校)Joel Wertheim团队
适用场景
- 病毒系统发育研究:通过基因序列和系统发育树分析大猩猩单纯疱疹病毒与人类疱疹病毒的进化关系
- 人兽共患病起源分析:探究HSV-2的跨物种传播历史及 zoonotic 起源机制
- 病毒基因组比较:基于FASTA序列比对数据开展不同疱疹病毒的基因组结构与功能研究
- 进化生物学研究:利用分子钟假设检验分析病毒与宿主的共分化及跨物种传播事件时间线