数据集概述
本数据集为丹麦海洋与淡水环境下三刺鱼基因组分化研究数据,包含28,888个SNP位点分析结果,涉及2个海洋种群与7个淡水种群(河流、隔离湖泊等不同环境)。数据用于探究选择、基因流及种群历史(如瓶颈效应)对基因组分化的影响,揭示淡水种群形态与基因组分化模式,共含10个文件。
文件详解
- 基因型与种群结构文件
- 文件名称:
sticklebacks_DK.nosex、sticklebacks_DK.bed、sticklebacks_DK.fam、sticklebacks_DK.bim
- 文件格式:nosex、bed、fam、bim
- 字段映射介绍:群体遗传学常用格式文件,包含样本性别信息、基因型数据、家系信息、SNP位点的染色体位置与等位基因信息
- 遗传分析结果文件
- 文件名称:
amova_Fst_outlier_test_sorted_by_chromosome_used_for_Fig_5.txt
- 文件格式:txt
- 字段映射介绍:按染色体排序的AMOVA与Fst离群位点检测结果,用于识别受选择的基因组区域
- 表型数据文件
- 文件名称:
phenotypic_data_new.xlsx
- 文件格式:xlsx
- 字段映射介绍:包含三刺鱼形态等表型数据,用于关联基因型与表型特征
- 基因数据格式文件
- 文件名称:
Danish_sticklebacks.arp、Danish_sticklebacks_genepop.txt、sticklebacks_Danish.vcf
- 文件格式:arp、txt、vcf
- 字段映射介绍:不同格式的基因型数据文件,支持多种种群遗传分析工具(如GenePop)导入使用
- 分析日志文件
- 文件名称:
sticklebacks_DK.log
- 文件格式:log
- 字段映射介绍:记录基因组分析过程的日志信息,用于追溯分析步骤与参数
数据来源
论文“The impact of selection, gene flow and demographic history on heterogeneous genomic divergence: threespine sticklebacks in divergent environments”
适用场景
- 种群基因组分化研究:分析淡水与海洋三刺鱼基因组分化模式,探究选择、基因流及种群历史的作用
- 选择信号检测:利用Fst离群位点检测结果,识别受自然选择的基因组区域
- 表型与基因型关联分析:结合表型数据与SNP位点信息,研究形态特征的遗传基础
- 种群历史推断:通过等位基因频率谱分析淡水种群的瓶颈效应等种群历史事件
- 环境对基因组进化的影响研究:比较不同淡水环境(河流、隔离湖泊)种群的基因组分化差异