数据集概述
本数据集包含马铃薯靶向基因分型(GBS)的DArTag技术数据及R/polyBreedR分析结果,涵盖2.5K和4K靶向标记的VCF文件、系谱数据、性状数据、错误分析等14个文件,支持马铃薯育种中的基因组选择、连锁图谱构建及性状关联分析。
文件详解
- 基因分型数据文件
- 文件名称:FileS1-DArTagV1.vcf.gz、FileS3-DArTagV2.vcf.gz、FileS5-SNParrayV4.vcf.gz
- 文件格式:VCF.GZ
- 字段映射介绍:包含马铃薯DArTag V1(2503个标记)、DArTag V2(扩展至4K标记)及SNP芯片V4的基因分型数据,记录样本ID、染色体位置、等位基因信息等标准VCF字段。
- 元数据与系谱文件
- 文件名称:FileS2-V1metadata.csv、FileS6-W19diallel_pedigree.csv、FileS7-W19diallel_phased_parents.csv
- 文件格式:CSV
- 字段映射介绍:FileS2记录DArTag V1样本的ID、提交年份;FileS6记录半双列杂交群体的系谱信息(id、群体、母本、父本、倍性);FileS7记录亲本的相位信息。
- 性状与分析结果文件
- 文件名称:FileS10-W21diallel_trait.csv、FileS12-V1_error.csv、FileS13-V2_error.csv
- 文件格式:CSV
- 字段映射介绍:FileS10记录双列杂交群体的性状数据(如标记位点的基因型);FileS12、FileS13分别记录DArTag V1、V2的错误分析结果。
- 其他文件
- 文件名称:README.md、FileS11-OFP20alignment.docx、FileS4-DArTagV2_madc.csv
- 文件格式:MD、DOCX、CSV
- 字段映射介绍:README.md说明数据集内容;FileS11为比对文档;FileS4记录DArTag V2的标记数据。
数据来源
Dryad数据集(DOI: 10.5061/dryad.8pk0p2nw4)
适用场景
- 马铃薯基因组选择研究:利用DArTag标记数据进行育种候选株系的基因组选择模型构建与验证。
- 多倍体标记数据分析:通过polyBreedR软件处理马铃薯四倍体的标记数据,开展连锁图谱构建与QTL定位。
- 性状关联分析:结合系谱、基因分型与性状数据,分析马铃薯病毒Y抗性、块茎形状等性状的遗传基础。
- 基因分型技术比较:对比DArTag与SNP芯片平台的标记一致性及定量准确性,优化基因分型方案。