数据集概述
本数据集为Recomb 2022待提交论文“Genetic Polyploid Phasing using Marker Signals from Low-Depth Progeny Samples”的评估用数据,包含17个文件,用于遗传多倍体定相方法的验证与分析,数据由指定脚本生成或使用。
文件详解
- 定相数据文件(.gz格式)
- 文件名称:如ch04.71Mx-0.25.parents.decluttered.vcf.gz、ch05.hifiasm.vcf.gz、ch03.60Mx.progeny.decluttered.vcf.gz等(共15个)
- 文件格式:GZ压缩
- 字段映射介绍:包含多倍体样本的基因定相数据,涉及不同染色体(ch03、ch04、ch05)、测序深度参数(如0.25、0.5)及样本类型(parents、progeny)的去冗余VCF数据
- 样本信息文件
- 文件名称:ped.txt
- 文件格式:TXT
- 字段映射介绍:包含样本信息,如Altus_470bp、Colomba_470bp、HZK_11-0001等样本标识
- 下采样数据压缩包
- 文件名称:ped-downsamples.zip
- 文件格式:ZIP
- 字段映射介绍:包含样本下采样相关数据的压缩文件
数据来源
AlBi-HHU的genetic-phasing-scripts脚本(https://github.com/AlBi-HHU/genetic-phasing-scripts)及Recomb 2022待提交论文相关实验
适用场景
- 遗传多倍体定相方法验证: 用于评估基于低深度后代样本标记信号的多倍体定相算法性能
- 生物信息学算法研究: 支持基因定相领域的算法开发与优化
- 基因组学实验分析: 为多倍体生物的基因数据处理提供实验数据支撑
- 测序数据下采样研究: 分析不同深度测序数据对定相结果的影响