数据集概述
本数据集支持BMC Genomics发表的虎纹钝口螈SNP频率研究论文,包含454焦磷酸测序原始数据及组装contig序列,用于分析contig长度和测序深度对SNP频率估算的影响,以及编码与非编码转录本的SNP丰度差异,验证长非编码转录本保守性较低的假设。
文件详解
- README文件
- 文件名称:README_for_AllTigerSalamander.txt
- 文件格式:TXT
- 字段映射介绍:说明数据与论文的关联,列出压缩包内包含的3个支持数据文件
- 压缩包文件
- 文件名称:AllTigerSalamander.zip
- 文件格式:ZIP
- 字段映射介绍:包含3个数据文件,分别为AllTigerSalamander_RawFileFrom454.sff(454测序原始数据)、AllTigerSalamander_ContigFromPCAP.bases(contig序列文本文件)等
数据来源
论文“The effects of contig length and depth on the estimation of SNP frequencies, and the relative abundance of SNPs in protein-coding and non-coding transcripts of tiger salamanders (Ambystoma tigrinum)”
适用场景
- 基因组多态性分析: 研究虎纹钝口螈编码与非编码转录本的SNP频率差异,验证长非编码转录本的保守性特征
- 测序数据处理优化: 分析contig长度和测序深度对SNP频率估算的影响,优化SNP检测方法
- 转录组进化研究: 比较不同功能转录本的多态性水平,探究基因组进化规律
- 生物信息学模型验证: 验证考虑测序深度和contig长度的SNP频率估算模型的有效性