数据集概述
本数据集为系统基因组学模型比较研究的配套数据,包含47个跨生命树的系统基因组数据集的模型验证与比较结果,涉及替换模型、串联模型和多物种溯祖模型(MSC)的适用性评估,揭示不同模型在系统发育分析中的拟合度差异及影响因素。
文件详解
- 压缩文件(model_validation_data.zip)
- 文件名称:model_validation_data.zip
- 文件格式:ZIP
- 字段映射介绍:包含47个系统基因组数据集的模型验证原始数据,涉及替换模型拟合度、串联模型基因树拓扑一致性假设检验、MSC模型验证结果等核心数据内容。
- 附录文档(Appendix.docx)
- 文件名称:Appendix.docx
- 文件格式:DOCX
- 字段映射介绍:研究的补充附录文档,可能包含模型验证方法细节、统计检验流程、数据处理步骤及补充分析结果等内容。
数据来源
论文“The multispecies coalescent model outperforms concatenation across diverse phylogenomic”
适用场景
- 系统发育模型评估研究:用于比较多物种溯祖模型与串联模型在不同系统基因组数据集上的拟合度与适用性。
- 替换模型拟合度分析:探究GC含量、信息位点比例等因素对替换模型拟合效果的影响。
- 系统基因组学数据分析方法优化:为系统发育分析中模型选择与验证提供方法论参考。
- 物种树推断可靠性研究:分析模型拟合度对物种树估计结果的影响机制。