数据集概述
本数据集围绕线粒体基因树变异展开,旨在探究系统误差对基因树拓扑结构差异的影响,区分生物过程与方法学因素在基因树变异中的相对作用。通过控制生物因素,估算系统误差导致的基因树不一致程度,并利用后验预测分析模型拟合的作用,为解决系统发育问题提供参考。
文件详解
- 压缩文件(Archive files)
- 文件名称:Test_Stat_Rank_Corr.zip、Treescaper_input_files.zip、nexus_alignment_files.tar.gz、95_ref_incompatibilities_ppes_r2.zip、Summary Trees.zip、gene_to_reference_incompatibilities.zip、PPES_calculation.zip
- 文件格式:.zip、.tar.gz
- 字段映射介绍:包含测试统计量、树结构分析输入文件、序列比对文件、参考树不一致性数据、汇总树文件、基因与参考树不一致性数据及后验预测分析计算相关的压缩数据
- 代码文件(Code files)
- 文件名称:chitest.py
- 文件格式:.py
- 字段映射介绍:用于执行卡方检验的Python脚本文件
- 文档文件(Document files)
- 文件名称:Richards_et_al_2018_supplementary.docx
- 文件格式:.docx
- 字段映射介绍:研究的补充文档,包含实验方法、结果等辅助说明内容
数据来源
论文“Variation across mitochondrial gene trees provides evidence for systematic error: how much gene tree variation is biological?”
适用场景
- 系统发育树构建误差分析: 用于评估模型拟合对基因树拓扑结构差异的影响,优化系统发育树构建方法
- 生物信息学模型验证: 检验系统发育分析中模型假设与实际数据的拟合程度,提升模型可靠性
- 基因树变异机制研究: 区分生物过程与方法学因素在基因树不一致中的贡献,解析变异驱动机制
- 系统发育问题解决: 为解决未决的系统发育问题提供方法学参考,指导相关研究的模型选择与数据处理