数据集概述
本数据集为小鼠通用基因分型阵列(GigaMUGA)相关数据,包含143,259个探针的Illumina Infinium II阵列信息,适用于小鼠遗传图谱构建、种群遗传学研究及实验室种群遗传完整性监测,覆盖实验室近交系、重组近交系、远交种群及野生小鼠样本。
文件详解
- 文件名称:refsamples.rds
- 文件格式:RDS
- 字段映射介绍:存储高质量参考样本相关数据,具体字段未提供,推测包含样本基因型或表型信息
- 文件名称:refsamples.fam
- 文件格式:FAM
- 字段映射介绍:PLINK格式样本信息文件,通常包含家系、个体ID、亲子关系、性别等样本元数据
- 文件名称:refsamples.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:压缩的CSV文件,推测包含样本基因型或表型的结构化数据
- 文件名称:refsamples.bim
- 文件格式:BIM
- 字段映射介绍:PLINK格式标记信息文件,通常包含染色体、标记ID、遗传距离、物理位置、等位基因等探针元数据
- 文件名称:refsamples.bed
- 文件格式:BED
- 字段映射介绍:PLINK格式二进制基因型数据文件,存储样本的基因型信息
数据来源
论文“The Mouse Universal Genotyping Array: from substrains to subspecies”
适用场景
- 小鼠遗传图谱构建: 利用阵列探针数据进行实验室近交系、重组近交系等种群的遗传定位研究
- 种群遗传学分析: 分析实验室种群与野生小鼠种群的遗传多样性及种群结构
- 实验室种群遗传完整性监测: 检测实验室小鼠种群的遗传变异及纯度
- 基因拷贝数变异研究: 利用阵列中2006个拷贝数探针分析小鼠基因组结构多态区域的拷贝数变异
- 基因型数据质量控制: 基于参考样本数据进行基因分型阵列的质量评估与优化