数据集概述
本数据集为甲虫(Coleoptera)系统发育研究提供基因组范围的核蛋白编码(NPC)标记资源。包含1470个候选基因座及95个可PCR扩增的标记,可解决甲虫从深层到浅层的进化分歧问题,为昆虫系统发育研究提供高效且信息丰富的分子标记工具。
文件详解
- 文档文件
- 文件名称:README_for_python_scripts1.txt
- 文件格式:TXT
- 字段映射介绍:包含Python脚本使用说明,如Filter_long_single_copy_seqs.py的参数说明(输入文件名、BLASTN数据库名、期望值阈值等),作者信息为Liheng Che(cheliheng@126.com),日期为2016年4月25日。
- 压缩文件
- 文件名称:Supplemental_Tables.zip
- 文件格式:ZIP
- 字段映射介绍:补充表格压缩包,推测包含研究相关的补充数据表格。
- 文件名称:data_nex.zip
- 文件格式:ZIP
- 字段映射介绍:NEX格式数据压缩包,可能包含系统发育分析用的序列数据。
- 文件名称:DataBase_1470candidates.zip
- 文件格式:ZIP
- 字段映射介绍:1470个候选基因座数据库压缩包,为核心标记资源文件。
- 文件名称:python_scripts1.rar
- 文件格式:RAR
- 字段映射介绍:Python脚本压缩包,包含用于筛选单拷贝长序列的分析脚本。
数据来源
论文“Genome-wide survey of nuclear protein-coding markers for beetle phylogenetics and their application in resolving both deep and shallow-level divergences”
适用场景
- 甲虫系统发育关系研究: 利用95个NPC标记分析甲虫从科水平到种水平的进化分歧,构建高支持度的系统发育树。
- 昆虫分子标记开发: 基于1470个候选基因座,开发适用于其他昆虫类群的核蛋白编码标记。
- 进化生物学研究: 探究甲虫快速辐射演化的分子机制,分析不同进化深度的分歧事件。
- 生物信息学方法应用: 使用提供的Python脚本进行序列筛选、BLAST分析等生物信息学流程开发与优化。