数据集概述
本数据集是论文“Adding to the Lepidoptera phylogeny: Capturing hundreds of nuclear genes from old museum specimens”(第1章)的补充表格,包含4个Excel文件,涵盖研究样本信息、已发表转录组和基因组数据、Genbank的COI序列登录号、分类单元在最终比对中的存在/缺失矩阵,支持鳞翅目系统发育研究的样本与数据溯源分析。
文件详解
- Table S1.xlsx
- 文件格式:XLSX
- 字段映射介绍:研究纳入样本的信息,包含样本基本信息及基于过滤后的1109个基因座NT12数据集计算的缺口和歧义百分比
- Table S2.xlsx
- 文件格式:XLSX
- 字段映射介绍:研究中纳入的已发表转录组和基因组数据的详细信息
- Table S3.xlsx
- 文件格式:XLSX
- 字段映射介绍:从Genbank获取的COI序列的登录号信息
- Table S4.xlsx
- 文件格式:XLSX
- 字段映射介绍:分类单元在最终比对中的存在/缺失矩阵,目标富集分类单元标黄;首列为比对名称(由EOG编号、Danaus基因名、外显子编号、基因总外显子数、比对软件组合构成),列按每个分类单元的总比对数排序,行按物种总数排序
数据来源
Mayer et al. 提交的论文“Adding to the Lepidoptera phylogeny: Capturing hundreds of nuclear genes from old museum specimens”(Chapter 1)
适用场景
- 鳞翅目系统发育研究:用于分析样本信息、基因数据来源及分类单元在序列比对中的分布特征
- 博物馆标本基因数据应用:支持旧博物馆标本在系统发育研究中的基因捕获方法验证
- 生物信息学数据溯源:通过Genbank登录号和发表数据信息追溯研究中基因序列的原始来源
- 分类单元比对矩阵分析:探究目标富集分类单元与其他分类单元在序列比对中的存在/缺失差异