数据集概述
本数据集围绕ITS1与ITS2作为真核生物DNA条形码的性能比较展开,包含大规模元分析所需的数据与代码文件。研究覆盖子囊菌、担子菌等十大类真核生物,涉及85,345个序列对,从PCR扩增、测序及物种鉴别三方面评估两者的效率与特性,为DNA条形码选择提供依据。
文件详解
- 文件名称:README_for_Codes for Species Identification Efficiencies.txt
- 文件格式:TXT
- 字段映射介绍:包含PESDET(按分类群评估物种鉴别效率的工具包)的使用说明,提及主要脚本g1_pesdet_setup.pl和g2_pesdet_run.pl,以及bin和sample_data文件夹的存在。
- 文件名称:Code for DNA barcoding Gaps.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:用于分析DNA条形码间隙的代码文件压缩包。
- 文件名称:Dataset_II.xlsx
- 文件格式:XLSX
- 字段映射介绍:实验分析所用的数据集文件之一,具体字段未明确,推测包含用于比较分析的序列或分类群数据。
- 文件名称:Codes for Species Identification Efficiencies.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:用于计算物种鉴别效率的代码文件压缩包。
- 文件名称:Dataset_I.xlsx
- 文件格式:XLSX
- 字段映射介绍:实验分析所用的数据集文件之一,具体字段未明确,推测包含用于PCR扩增评估、序列长度及GC含量分析的原始数据。
数据来源
论文“ITS1: a DNA barcode better than ITS2 in eukaryotes?”
适用场景
- DNA条形码选择研究:对比ITS1与ITS2在不同真核生物类群中的物种鉴别效率,为DNA条形码标准制定提供数据支持。
- 分子分类学分析:利用数据集评估特定类群(如真菌、植物、动物)的DNA条形码间隙与物种分辨率。
- 生物信息学方法验证:通过代码文件复现物种鉴别效率计算与DNA条形码间隙分析的流程。
- 引物设计优化:基于PCR扩增评估结果,优化真核生物DNA条形码的通用引物设计。