数据集概述
该数据集围绕鲎类(Xiphosura)的系统发育定位展开,基于螯肢亚门(Chelicerata)系统发育误差来源的批判性评估研究。包含系统发育分析数据、模拟测试脚本及补充材料,支持探究鲎类是否嵌套于蛛形纲(Arachnida)及其与系统发育误差因素的关联。
文件详解
该数据集包含15个文件,按类型分类说明如下:
- 系统发育分析数据文件:
- Concat_721_MARE.fasta、Concat_3534_indep.fasta:FASTA格式的序列拼接文件,用于系统发育分析
- MAREpart.nex、part_1499.nex、Partition_3534.txt.best_scheme.nex:NEXUS格式的分区文件,定义序列数据的进化模型分区
- Lithobius_atkinsoni_SAMN10093766.fasta、Pycnogonium_littorale_SAMN10093767.fasta:FASTA格式的物种序列文件,包含特定物种的基因序列
- datbacoca_pca.csv:CSV格式数据文件,含系统发育分析相关指标,字段包括File、is Desicive、winner_LG、DGLS_LG、N taxa (informative)、AlnLen、MPSI及氨基酸频率(p(A)、p(V)等)
- matrices.xlsx:Excel格式文件,可能包含系统发育矩阵数据
- 脚本文件(.py格式):
- splitDist.py、simulations.py、mpsi.py、droptips.py:Python脚本,用于系统发育分析中的数据处理、模拟测试等任务
- 压缩文件:
- NEWICKS 2.zip:ZIP格式压缩文件,可能包含系统发育树(Newick格式)相关数据
- 补充材料:
- Supplemental_Tables_and_Figures.pdf:PDF格式文档,包含研究的补充表格和图表
适用场景
- 螯肢亚门系统发育研究:验证鲎类在蛛形纲中的嵌套位置,重新评估传统进化范式
- 系统发育误差分析:探究不完全谱系分选、组成偏差、饱和等因素对系统发育推断的影响
- 进化生物学模拟:利用模拟脚本研究谱系分选水平对物种定位的影响
- 分子系统学方法评估:测试不同数据分区、进化模型对系统发育结果的影响