数据集概述
本数据集围绕近完美病毒系统发育树的准确性展开研究,分析真实数据中短边导致的树结构解析问题,提出基于假阳性率的准确性定义,通过理论推导和模拟验证最大简约法与最大似然法的应用,并探讨自举法支持度的局限性。数据支持病毒暴发期间演化研究,包含两个相关文件。
文件详解
- 文件名称:SystBiol_DataS1_20210505.xlsx
- 文件格式:XLSX
- 字段映射介绍:未提供具体字段信息,推测为研究中使用的结构化数据表格,可能包含系统发育树参数、模拟结果或分析指标等内容
- 文件名称:SystBiol_DataS2_20210505.txt
- 文件格式:TXT
- 字段映射介绍:包含病毒序列信息,示例内容为西尼罗河病毒(WNV)的菌株名称、GenBank编号及基因组描述,如"WNV AF481864.1 West Nile virus strain IS-98 STD, complete genome"
适用场景
- 病毒系统发育树构建方法评估: 分析不同算法(最大简约法、最大似然法)在近完美参数空间下的准确性
- 病毒演化研究: 支持人类病毒(如埃博拉病毒、寨卡病毒、SARS-CoV-2)暴发期间低替换率、高传播率场景下的系统发育分析
- 系统发育树准确性指标研究: 验证假阳性率作为短边主导树结构时准确性定义的合理性
- 自举法支持度局限性分析: 探讨自举重采样在近完美树中对分支支持度评估的偏差问题
- 病毒序列数据应用: 利用TXT文件中的病毒序列信息开展相关基因组学研究