数据集概述
本数据集围绕草地蝗虫Pseudochorthippus parallelus的自然杂交带展开,聚焦物种形成后期的基因渐渗现象,结合线粒体与核基因数据,分析生殖隔离屏障(如杂交雄性不育)的演化速度及其对遗传边界维持的影响,包含27个相关数据文件。
文件详解
- 文档类文件
- 文件名称:
README.txt、Brower_XML_publication.xml
- 文件格式:TXT、XML
- 字段映射介绍:包含数据集描述、DOI信息、提交作者、文件内容说明等元数据,以及发表相关的XML元数据。
- 基因分析文件
- 文件名称:
per_gene_tajd.txt、per_gene_fst_pyr、per_gene_theta.txt、per_gene_fst_alp、per_gene_pi.txt
- 文件格式:TXT
- 字段映射介绍:包含多个种群(如POR、CSY、ERY等)的基因水平分析指标,如Tajima's D、Fst、Theta、Pi等遗传多样性与分化参数。
- 序列频率谱文件
- 文件名称:
SFS_DOB.sfs、SFS_ERY.sfs、SFS_PHZ.sfs、SFS_TAR.sfs等共12个
- 文件格式:.sfs
- 字段映射介绍:记录不同种群的位点频率谱数据,反映基因频率分布特征。
- 主成分分析文件
- 文件名称:
pca_50plink.clst、pca_50plink.covar
- 文件格式:CLST、COVAR
- 字段映射介绍:包含主成分分析的聚类结果和协变量数据,用于种群遗传结构分析。
- 序列比对与基因型文件
- 文件名称:
FcC_smatrix.fa、newbeagle50.beagle.gz、newbeagle55.beagle.gz、alignments_md10.tar.gz
- 文件格式:FA、GZ、TAR.GZ
- 字段映射介绍:包含序列比对矩阵、Beagle格式的基因型数据压缩包,以及基因序列比对文件压缩包。
- 基因分化文件
- 文件名称:
per_gene_dxy_alp.csv、per_gene_dxy_pyr.csv
- 文件格式:CSV
- 字段映射介绍:包含基因区域(如chr1:1-9898)的dxy(核苷酸分化度)、有效位点数量等分化指标。
数据来源
Dryad数据集(标题:Extensive introgression despite Haldane’s rule: Insights from grasshopper hybrid zones)
适用场景
- 物种形成机制研究:分析生殖隔离屏障(如杂交雄性不育)在物种形成后期的演化速度与作用。
- 基因渐渗分析:探究自然杂交带中基因流模式,以及生殖隔离强度对基因渐渗的影响。
- 种群遗传结构分析:利用PCA、Fst等数据研究草地蝗虫种群的遗传分化与结构。
- 基因组分化模式研究:识别与生殖隔离相关的重复基因组分化区域,解析其遗传基础。
- 生物地理学研究:结合种群遗传数据与地理分布,分析冰期避难所与种群扩张对遗传分化的影响。