数据集概述
本数据集包含支持科学论文《海洋蜗牛物种形成不同阶段的表型分化与基因组结构》的基因组数据与分析脚本,涉及遗传群体信息、SNP位点筛选、PCA分析、空间数据等内容,为研究海洋蜗牛物种形成过程提供基础数据与分析工具。
文件详解
- 说明文档:
- README.txt:TXT格式,提供数据集整体描述、作者信息及关联出版物信息。
- 遗传群体与表型数据:
- CZEA_info_genet_group.txt、info_genet_group.csv:TXT/CSV格式,包含遗传群体分组信息。
- ER_EA_genetic_group_sexe_table.csv:CSV格式,含蜗牛个体ID、遗传群体(如Red)、性别(female/male)字段。
- habitat_vs_BlueRed.csv:CSV格式,可能关联栖息地与表型(Blue/Red)的数据。
- 位点筛选数据:
- CZE_positions_to_keep_1kb_s1.txt、CZE_positions_to_keep_1kb_s3.txt、EA1EA2_positions_to_keep_1kb_s1.txt、EA1EA2_positions_to_keep_1kb_s3.txt:TXT格式,记录不同群体(CZE/EA1EA2)不同筛选条件下保留的SNP位点信息。
- 基因组分析脚本:
- 24.Genomic_analysis_Fst.R、25.PCA_per_inversions_EA.R、26.PCA_EA_CZE_suprow.R、27.PCA_per_inversions_CZE.R:R格式,用于Fst分析、基于倒位的PCA分析等基因组数据分析。
- 倒位与空间数据:
- inv_positions_James_Mol_Ecol.tsv:TSV格式,含染色体连锁群(LG)、倒位起始/终止位置(cM)字段。
- CZE_spatial_LCP_20190523_mod.csv:CSV格式,可能包含CZE群体的空间数据。
- 压缩数据文件:
- CZE_PCAbyMapPos.zip、CZE_only_CZE_SNPs_PCA_per_inversion_data.zip、EA1EA2_PCAbyinversions.zip:ZIP格式,存储PCA分析相关的压缩数据。
适用场景
- 进化生物学研究:分析海洋蜗牛物种形成不同阶段的基因组结构变化。
- 群体遗传学分析:探究遗传群体分化、基因流及选择压力。
- 表型与基因型关联研究:关联表型(如Blue/Red)与基因组位点或倒位区域。
- 生物信息学方法应用:复现或扩展基因组数据分析(如Fst、PCA)流程。