数据集概述
本数据集围绕非模式物种序列标记的开发、验证及高通量分析展开,提供了适用于无参考基因组物种的遗传标记设计框架相关数据,包含标记序列、基因型数据、生物信息学脚本及参考序列等,可支持群体遗传学、系统发育学研究中标记的应用与分析。
文件详解
- VCF_files.tar
- 文件格式:TAR(压缩包)
- 字段映射介绍:包含变异调用格式(VCF)文件,记录序列标记的遗传变异信息
- Script.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:包含生物信息学分析脚本,用于数据处理及标记分析
- SAM_files.tar.gz
- 文件格式:TAR.GZ(压缩包)
- 字段映射介绍:包含序列比对/映射格式(SAM)文件,记录测序 reads 与参考序列的比对结果
- Genotypes
- 文件格式:无扩展名
- 字段映射介绍:包含样本的基因型数据,记录序列标记的基因型信息
- Reconstructed_sequences.tar
- 文件格式:TAR(压缩包)
- 字段映射介绍:包含重建的序列数据,记录开发的序列标记的核苷酸序列
- Reference_contigs.fasta
- 文件格式:FASTA
- 字段映射介绍:包含参考 contig 序列,作为序列比对及标记开发的参考基因组片段
- Translation_table.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含翻译表数据,记录核苷酸序列与氨基酸序列的对应关系
数据来源
论文“Data from: Development, validation and high-throughput analysis of sequence markers in nonmodel species”
适用场景
- 非模式物种遗传标记开发: 用于设计、验证适用于无参考基因组物种的序列标记
- 群体遗传学研究: 分析物种的种群遗传结构、基因流及遗传多样性
- 系统发育学分析: 构建物种间的系统发育关系,探究物种演化历史
- 生物信息学方法验证: 验证非模式物种序列标记高通量分析流程的有效性与准确性
- 遗传多样性评估: 利用标记数据评估物种的遗传多样性水平及种群分化程度