数据集概述
本数据集包含犬类(品种犬、乡村犬)和灰狼的全基因组测序分析数据,聚焦驯化与育种过程中有害遗传变异的变化。通过90个样本的基因组数据,评估有害变异的基因组模式,量化驯化相关瓶颈对遗传负荷的影响,揭示选择清除区域与有害变异的关联。数据集共7个文件,支持对犬类遗传负荷、选择压力及育种代价的研究。
文件详解
- 说明文档(README文件)
- 文件名称:
README_for_DOG_jackknife_on_sweep_nonsweep_data.txt、README_for_Gene_IDs_overlapping_sweep_regions.final.txt、README_for_Dogwolf_vcf_Filtered_coding_region_with_Miyata_and_GerpScore_annotated.vcf.txt
- 文件格式:TXT
- 字段映射介绍:分别对应犬类刀切法分析、选择清除区域基因ID、过滤编码区VCF文件的说明文档,解释数据生成方法、字段含义及使用说明。
- 基因组数据文件
- 文件名称:
Dogwolf_vcf_Filtered_coding_region_with_Miyata_and_GerpScore_annotated.vcf.gz
- 文件格式:VCF.GZ
- 字段映射介绍:过滤后的犬类与灰狼编码区变异数据,包含Miyata得分(氨基酸替换保守性)和GerpScore(进化保守性)注释,记录变异位置、等位基因及功能注释信息。
- 基因ID文件
- 文件名称:
Gene_IDs_overlapping_sweep_regions.final.xlsx
- 文件格式:XLSX
- 字段映射介绍:与选择清除区域重叠的基因ID列表,支持分析选择清除区域的功能基因。
- 统计分析数据
- 文件名称:
DOG_jackknife_on_sweep_nonsweep_data.txt、WOLF_jackknife_on_sweep_nonsweep_data.txt
- 文件格式:TXT
- 字段映射介绍:犬类和灰狼的刀切法分析结果,包含类别(如Sweep_4f)、位点数量、变异位点数、衍生等位基因总数、核苷酸多样性(pi)等统计指标,用于比较选择清除区域与非清除区域的遗传变异模式。
数据来源
论文“Bottlenecks and selective sweeps during domestication have increased deleterious genetic variation in dogs”
适用场景
- 犬类驯化遗传效应研究: 分析驯化瓶颈对犬类有害遗传变异积累的影响,量化遗传负荷变化。
- 选择清除与有害变异关联分析: 利用选择清除区域基因ID和VCF数据,探究人工选择对有害变异的富集作用。
- 犬类育种代价评估: 通过遗传负荷数据,评估品种选育对犬类健康的潜在负面影响,为育种策略提供参考。
- 进化遗传学研究: 比较犬类与灰狼的基因组保守性(GerpScore)和氨基酸替换模式(Miyata得分),揭示驯化过程的进化压力。
- 濒危物种保护参考: 基于犬类数据的结论,为珍稀物种保护中种群规模维持、遗传多样性管理提供理论支持。