数据集概述
本数据集围绕后生动物水平通用单拷贝直系同源基因(USCOs)展开,验证其作为物种界定与分类分子标记的代表性、分布均匀性及适用性,通过239个染色体水平基因组分析及四个案例研究,证明USCOs可替代或补充单基因条形码,提供更准确的分类推断。
文件详解
- 描述文件(TXT格式):
- concat_alignments_descriptions.txt:说明串联比对文件内容,如anopheles_busco_concat.fas为按Fasta格式存储的按蚊OrthoDB 9 USCOs串联比对结果
- nmds_plots_descriptions.txt:NMDS(非度量多维尺度分析)图相关描述
- harvesting_dryad_readme.txt:数据获取与处理相关说明
- partition_files_descriptions.txt:分区文件内容说明
- all_data_gene_alignments_descriptions.txt:全数据基因比对文件说明
- all_data_gene_trees_descriptions.txt:全数据基因树文件说明
- all_data_concat_alignments_descriptions.txt:全数据串联比对文件说明
- all_data_astral_trees_descriptions.txt:全数据ASTRAL树文件说明
- snp_alignments_descriptions.txt:SNP比对文件说明
- all_data_concat_trees_descriptions.txt:全数据串联树文件说明
- astral_trees_descriptions.txt:ASTRAL树文件说明
- all_data_partitions_descriptions.txt:全数据分区文件说明
- concat_trees_descriptions.txt:串联树文件说明
- gene_trees_descriptions.txt:基因树文件说明
- gene_alignments_descriptions.txt:基因比对文件说明
- snp_nmds_descriptions.txt:SNP的NMDS分析说明
- structure_plots_descriptions.txt:结构分析图说明
- species_delimitation_descriptions.txt:物种界定相关说明
- README.md:数据集整体说明文档
- 压缩文件(ZIP格式):
- all_data_concat_trees.zip:全数据串联树文件压缩包
- all_data_gene_trees.zip:全数据基因树文件压缩包
- metazoa_busco_aa_trees.zip:后生动物BUSCO氨基酸树文件压缩包
- usco_position_tables.zip:USCO位置表文件压缩包
- concat_trees.zip:串联树文件压缩包
- species_delimitation.zip:物种界定相关文件压缩包
- 树文件(TRE格式):
- metazoa_busco_nt12_concat.tre:后生动物BUSCO核苷酸12串联树
- metazoa_busco_aa_astral.tre:后生动物BUSCO氨基酸ASTRAL树
- metazoa_busco_aa_concat.tre:后生动物BUSCO氨基酸串联树
- metazoa_busco_nt12_astral.tre:后生动物BUSCO核苷酸12 ASTRAL树
- 图表文件(PDF格式):
- usco_diff_histograms_normed.pdf:标准化的USCO差异直方图
- usco_diff_histograms.pdf:USCO差异直方图
- 文本文件(TXT格式):
- usco_co-occurrence.txt:USCO共现信息
适用场景
- 动物分类学研究:利用USCOs进行物种界定与系统发育分析
- 基因组学分析:验证基因标记的代表性与分布均匀性
- 进化生物学研究:探究杂交事件与物种形成机制
- 分子生态学应用:补充或替代单基因条形码技术
- 生物信息学方法开发:优化直系同源基因参考库及比对方法