数据集概述
本数据集包含遗传连锁分析相关的原始数据与结果文件,涵盖基因型数据、遗传图谱、群体频率、家系信息及分析结果压缩包,共6个文件,支持遗传连锁研究及相关生物信息学分析。
文件详解
freq_NFE_hg19.txt(TXT格式):包含SNP位点的群体频率数据,字段包括SNP名称(Name)、频率(Freq)、染色体(Chr)、位置(Pos)。
genotype.tsv(TSV格式):包含基因型数据,字段包括SNP_ID及样本的基因型(如BB、AA、AB)。
hg19_grch37p5_chr_size_cumul.txt(TXT格式):包含hg19/GRCh37p5参考基因组的染色体大小及累积位置信息。
map_hg19.txt(TXT格式):包含基于hg19的遗传图谱数据,记录SNP位点的染色体位置等信息。
pedigree.txt(TXT格式):包含家系信息数据,用于遗传连锁分析中的家系结构定义。
linkage_analysis_1708550143.zip(ZIP格式):遗传连锁分析结果的压缩包,包含分析过程生成的结果文件。
数据来源
GitHub仓库https://github.com/gael-millot/genetic_linkage
适用场景
- 遗传连锁分析:用于研究基因位点间的连锁关系及遗传距离计算。
- 基因型数据挖掘:分析样本的基因型分布特征及群体遗传结构。
- 生物信息学研究:支持基于hg19参考基因组的遗传图谱构建与群体频率分析。
- 家系遗传研究:利用家系信息与基因型数据开展遗传病相关的连锁分析。