数据集概述
本数据集是关于丝虫线虫与沃尔巴克氏体共生体进化历史研究的补充数据,包含研究中使用的脚本、中间数据文件、补充表格和图表,支持分析共生体的获得、丢失、替换及核基因组转移等动态过程。
文件详解
数据集为一个ZIP压缩包,内部包含以下类别文件:
- 脚本文件:
- 4个Python脚本(FetchRegionSeq.py.gz、Reduce_alignment.py.gz、Reroot_rename_tree.py.gz、SelectMatches.py.gz),用于数据处理与分析。
- 数据目录:
- 1_WolbachiaAnnotation: 沃尔巴克氏体基因组的Prokka注释结果
- 2_WolbachiaOrthoFinder: 165个沃尔巴克氏体蛋白质组的 OrthoFinder 聚类结果
- 3_WolbachiaPhylogeny: 使用Astral推断的沃尔巴克氏体系统发育树
- 4_WolbachiaOrthoAlignments: 沃尔巴克氏体蛋白质直系同源组的序列比对文件
- 5_WolbachiaHMM: 基于沃尔巴克氏体直系同源组的核苷酸隐马尔可夫模型
- 6_NUWTtrees: 丝虫线虫核基因组中沃尔巴克氏体转移序列(NUWT)的系统发育树
- 7_NUWTmatches: 丝虫线虫基因组中NUWT位点的坐标与得分表(含直系同源组编号、物种缩写、沃尔巴克氏体超群来源等字段)
- 8_OnchocercidPhylogeny: 丝虫线虫系统发育分析的支撑数据(含ASTRAL和iQtree分析文件)
- 9_New_Nematode_and_Wolbachia_Genomes: 新增的线虫(Setaria labiatopapillosa)和沃尔巴克氏体基因组序列(FASTA格式)
- 补充表格:
- Table S1-S8: 包含线虫基因组指标、沃尔巴克氏体基因组数据、NUWT检测结果与分类等8个补充表格
- 补充图表:
- Figure S1-S8: 包含基因组组装结果图、沃尔巴克氏体系统发育树、NUWT相关的系统发育树等8个补充图表
适用场景
- 共生进化研究: 分析丝虫线虫与沃尔巴克氏体共生关系的动态变化(获得、丢失、替换)
- 基因组学分析: 研究沃尔巴克氏体核基因组转移(NUWT)在宿主进化中的作用
- 生物信息学方法应用: 参考系统发育树构建、蛋白质组聚类、序列比对等分析流程
- 寄生虫学研究: 为抗丝虫病药物靶点(沃尔巴克氏体)的研究提供进化背景支持