数据集概述
本数据集基于灰狼6个生态型的候选基因筛选结果,设计靶向捕获阵列对1040个候选基因(含外显子及侧翼区域)和5000个非基因中性区域进行重测序,覆盖107只灰狼样本。通过选择测试揭示候选基因与非候选区域的变异模式,识别与局部适应相关的潜在功能变异,验证全基因组SNP扫描标记功能基因的有效性。
文件详解
- 环境数据文件
- 文件名称:
AllSamples_n107_EnvData_wLatLong_toUpload.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含107只灰狼样本的环境数据及经纬度信息
- 捕获区域文件
- 文件名称:
NAwolf_capture_array_regions_Feb2012_canfam3.1.bed、NAwolf_baits_canfam3.1.bed
- 文件格式:BED
- 字段映射介绍:记录靶向捕获阵列的基因区域及探针信息
- 选择分析结果文件
- 文件名称:
SweeD_Report.Pop_*_*_10000_chrAll.txt系列(如SweeD_Report.Pop_4_HighArctic_Neutral_10000_chrAll.txt)、bayescan_n107_NeutralRegions_95CallRate_LDpruned_output_prior_odds_10000_fst.txt、bayenv1_output_n107_k6_Average_10Runs_NEUTRAL_forR.txt
- 文件格式:TXT
- 字段映射介绍:包含SweeD、Bayenv等选择测试的结果,涉及染色体(CHR)、碱基位置(BP)、环境变量(BIO1-BIO19等)、基因区域类型(中性/基因)及选择信号指标
- 基因型数据文件
- 文件名称:
Filtered_variableSites_fixedSamples_9July2014_minDP10noMissing_ecotypesOnly_n107_GenicRegions_95CallRate.recode.vcf
- 文件格式:VCF
- 字段映射介绍:过滤后的基因区域可变位点基因型数据,包含样本ID、基因型信息及质量控制指标
- 样本信息文件
- 文件名称:
AllSamples_n117_wLatLong.xlsx
- 文件格式:XLSX
- 字段映射介绍:117只灰狼样本的基本信息及经纬度数据
- 亲缘关系数据文件
- 文件名称:
NeutralSNPs_LDpruned_for_EmmaX.aBN.kinf
- 文件格式:KINF
- 字段映射介绍:基于中性SNP计算的样本亲缘关系矩阵
数据来源
论文“Targeted capture and resequencing of 1040 genes reveal environmentally driven functional variation in gray wolves”
适用场景
- 野生动物适应性进化研究:分析灰狼功能基因变异与环境因子的关联,探究局部适应机制
- 基因组选择信号分析:验证全基因组SNP扫描标记功能基因的有效性,优化选择分析方法
- 气候变化影响评估:研究北极等生态型灰狼的选择基因数量,评估气候变化对其生存的威胁
- 保护遗传学应用:识别灰狼关键功能基因的变异位点,为物种保护策略制定提供依据
- 基因功能注释研究:分析APOB、LIPG等基因的非同义变异与蛋白质功能域的关系