后生动物水平通用单拷贝直系同源基因在物种界定与分类中的应用数据集

数据集概述

本数据集围绕后生动物水平通用单拷贝直系同源基因(USCOs)展开,验证其作为物种界定与分类分子标记的代表性、分布均匀性及适用性,通过239个染色体水平基因组分析及四个案例研究,证明USCOs可替代或补充单基因条形码,提供更准确的分类推断。

文件详解

  • 描述文件(TXT格式):
  • concat_alignments_descriptions.txt:说明串联比对文件内容,如anopheles_busco_concat.fas为按Fasta格式存储的按蚊OrthoDB 9 USCOs串联比对结果
  • nmds_plots_descriptions.txt:NMDS(非度量多维尺度分析)图相关描述
  • harvesting_dryad_readme.txt:数据获取与处理相关说明
  • partition_files_descriptions.txt:分区文件内容说明
  • all_data_gene_alignments_descriptions.txt:全数据基因比对文件说明
  • all_data_gene_trees_descriptions.txt:全数据基因树文件说明
  • all_data_concat_alignments_descriptions.txt:全数据串联比对文件说明
  • all_data_astral_trees_descriptions.txt:全数据ASTRAL树文件说明
  • snp_alignments_descriptions.txt:SNP比对文件说明
  • all_data_concat_trees_descriptions.txt:全数据串联树文件说明
  • astral_trees_descriptions.txt:ASTRAL树文件说明
  • all_data_partitions_descriptions.txt:全数据分区文件说明
  • concat_trees_descriptions.txt:串联树文件说明
  • gene_trees_descriptions.txt:基因树文件说明
  • gene_alignments_descriptions.txt:基因比对文件说明
  • snp_nmds_descriptions.txt:SNP的NMDS分析说明
  • structure_plots_descriptions.txt:结构分析图说明
  • species_delimitation_descriptions.txt:物种界定相关说明
  • README.md:数据集整体说明文档
  • 压缩文件(ZIP格式):
  • all_data_concat_trees.zip:全数据串联树文件压缩包
  • all_data_gene_trees.zip:全数据基因树文件压缩包
  • metazoa_busco_aa_trees.zip:后生动物BUSCO氨基酸树文件压缩包
  • usco_position_tables.zip:USCO位置表文件压缩包
  • concat_trees.zip:串联树文件压缩包
  • species_delimitation.zip:物种界定相关文件压缩包
  • 树文件(TRE格式):
  • metazoa_busco_nt12_concat.tre:后生动物BUSCO核苷酸12串联树
  • metazoa_busco_aa_astral.tre:后生动物BUSCO氨基酸ASTRAL树
  • metazoa_busco_aa_concat.tre:后生动物BUSCO氨基酸串联树
  • metazoa_busco_nt12_astral.tre:后生动物BUSCO核苷酸12 ASTRAL树
  • 图表文件(PDF格式):
  • usco_diff_histograms_normed.pdf:标准化的USCO差异直方图
  • usco_diff_histograms.pdf:USCO差异直方图
  • 文本文件(TXT格式):
  • usco_co-occurrence.txt:USCO共现信息

适用场景

  • 动物分类学研究:利用USCOs进行物种界定与系统发育分析
  • 基因组学分析:验证基因标记的代表性与分布均匀性
  • 进化生物学研究:探究杂交事件与物种形成机制
  • 分子生态学应用:补充或替代单基因条形码技术
  • 生物信息学方法开发:优化直系同源基因参考库及比对方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 657.79 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。