数据集概述
本数据集基于瑞士石松(Pinus cembra)转录组测序与外显子捕获技术,针对其大基因组(29.3 Gbp)开展局部适应研究。包含7个文件,涵盖群体信息、探针序列、等位基因频率、转录组组装与注释等核心内容,支持针叶树大基因组选择扫描与适应性遗传变异分析。
文件详解
- 群体信息文件
- 文件名称:population_information.xlsx
- 文件格式:XLSX
- 字段映射介绍:记录瑞士阿尔卑斯山7个Pinus cembra群体的基础信息
- 探针序列文件
- 文件名称:probe_sequences.fasta
- 文件格式:FASTA
- 字段映射介绍:包含约55,000条自主设计的外显子捕获探针序列,靶向25,000个转录组contigs
- 等位基因频率文件
- 文件名称:allele_frequencies_7_populations.xlsx
- 文件格式:XLSX
- 字段映射介绍:7个群体的SNP等位基因频率数据,基于DNA池测序结果
- 转录组组装文件
- 文件名称:transcriptome_assembly.fasta
- 文件格式:FASTA
- 字段映射介绍:Pinus cembra转录组组装的contigs序列
- 多拷贝基因过滤文件
- 文件名称:contigs_HDplot_filtering.xlsx
- 文件格式:XLSX
- 字段映射介绍:基于杂合子过量与等位基因平衡偏差筛选的多拷贝contigs(旁系同源基因)信息
- RNA测序读长计数文件
- 文件名称:RNAseq_readcounts.xlsx
- 文件格式:XLSX
- 字段映射介绍:转录组测序的基因表达读长计数数据
- 转录组注释文件
- 文件名称:transcriptome_annotation.xlsx
- 文件格式:XLSX
- 字段映射介绍:Pinus cembra转录组contigs的功能注释信息
数据来源
论文“Using transcriptome sequencing and pooled exome capture to study local adaptation in the giga-genome of Pinus cembra”
适用场景
- 针叶树大基因组局部适应研究: 分析Pinus cembra群体的适应性遗传变异与环境关联
- 外显子捕获探针设计参考: 为大基因组物种的外显子捕获实验提供探针设计策略与序列资源
- 多拷贝基因筛选与校正: 基于杂合子过量和等位基因平衡偏差方法识别旁系同源基因,优化选择扫描分析
- 转录组功能注释分析: 结合转录组组装与注释数据,探究适应性相关基因的功能机制
- 群体遗传学研究: 利用等位基因频率数据开展群体结构、遗传多样性与基因流分析