数据集概述
本数据集为论文“Multiple sequence alignment averaging improves phylogeny reconstruction”的配套数据,包含ENSEMBLsim模拟数据集及相关补充材料。核心内容是通过生成多组替代多序列比对(MSA)并合并为SuperMSA,提升系统发育树重建准确性的方法验证数据,适用于分析分歧序列的系统发育研究。
文件详解
- 文件名称:README_for_ENSEMBLsim_dataset.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文档,包含数据背景、内容概述及使用指引,提及联系信息为Tal Pupko
- 文件名称:SuppMaterial_SuperMSA.docx
- 文件格式:DOCX
- 字段映射介绍:补充材料文档,推测包含研究方法细节、补充分析结果或图表等支持性内容
- 文件名称:ENSEMBLsim_dataset.zip
- 文件格式:ZIP
- 字段映射介绍:压缩归档文件,包含Indelible_ctrl_with_SpartaABC_params目录(推测为模拟实验控制文件)等核心数据内容
数据来源
论文“Multiple sequence alignment averaging improves phylogeny reconstruction” by Ashkenazy et al.
适用场景
- 系统发育树重建方法优化: 验证多序列比对平均化(SuperMSA)对提升树重建准确性的效果
- 生物信息学算法评估: 对比单MSA、加权MSA与SuperMSA方法的系统发育分析性能
- 分歧序列数据分析: 应用于高分歧序列的系统发育研究,挖掘传统方法遗漏的系统发育信号
- 计算生物学模拟实验: 基于Indelible模拟控制文件复现或扩展系统发育模拟实验