数据集概述
本数据集包含目标多重下一代测序技术的相关数据,用于非模式生物的群体基因组分析,支持同时对多重样本的线粒体和核基因座进行重测序。数据覆盖跨物种DNA捕获、线粒体基因组及核基因座的富集测序方法,涉及鲸类和绿海龟等物种的基因组数据,包含27个相关文件。
文件详解
- 文档文件(.txt)
- 文件名称:包括README_for_SpermWhale_50nucSeqs_SNPdisco_Fasta.txt、README_for_ngs-snp-pipeline-v3.2.txt等18个文件
- 文件格式:TXT
- 字段映射介绍:包含测序技术说明、流程文档、FASTA格式的基因序列(如FinWhale 43loci_Array1_fasta.txt含核基因座序列)
- 代码文件(.r)
- 文件名称:ngs-snp-pipeline-v3.2.r、ngs-mtdna-pipeline-v3.2.r、merged vcf to genotype.r
- 文件格式:R
- 字段映射介绍:线粒体基因组组装流程、SNP发现流程、VCF文件转基因型数据的脚本
- 归档文件(.zip)
- 文件名称:FinWhale_array.zip、Cmyd_array.zip、BeakedWhale_array.zip、SpermWhale_Array.zip、Spinner-SpottedDolphin_Array.zip
- 文件格式:ZIP
- 字段映射介绍:存储捕获阵列相关的压缩数据
- 其他文件(.rdata)
- 文件名称:ngs.funcs.rdata
- 文件格式:RDATA
- 字段映射介绍:包含测序分析所需的函数数据
适用场景
- 群体基因组学研究: 用于非模式生物的线粒体和核DNA多区域同时重测序分析
- 跨物种DNA捕获技术评估: 分析序列差异达约12%时的富集效率
- 遗传变异检测: 发现单核苷酸多态性(SNP),解析从地理到物种水平的遗传结构
- 线粒体基因组分析: 基于完整线粒体基因组数据研究物种遗传多样性
- 测序流程优化: 利用脚本文件优化目标捕获测序的实验与分析流程