数据集概述
本数据集为甘蔗螟虫(Diatraea saccharalis)的RAD测序(限制性位点相关DNA测序)数据,包含6个个体的122.8M双端测序读段(40 Gb),通过de novo组装获得12811个SNP标记及1.7 Mb基因组序列(5289个微型重叠群),可用于功能注释、微卫星发现及进化研究,共7个文件。
文件详解
- README.txt
- 文件格式:TXT
- 字段映射介绍:包含Stacks分析流程说明、文件夹创建步骤、条形码序列(如ATGTGTCGCCAA等6条)及process_radtags等分析命令的操作指引
- final_SNP_set.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内含最终筛选得到的12811个SNP标记数据集
- RepeatMasker_minicontigs_RADtag_loci.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内含经过RepeatMasker重复序列屏蔽处理的RADtag位点微型重叠群数据
- all_minicontigs_random_sheared_ends_kmer27.fa
- 文件格式:FA
- 字段映射介绍:FASTA格式文件,包含所有微型重叠群经随机剪切末端、kmer27处理后的序列数据
- microsatellites.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内含从微型重叠群中发现的微卫星标记数据集
- minicontigs_final_annotation_Blast2go.gff
- 文件格式:GFF
- 字段映射介绍:GFF格式文件,包含微型重叠群通过Blast2go完成的功能注释信息
- minicontigs_RADtag_loci.fa
- 文件格式:FA
- 字段映射介绍:FASTA格式文件,包含RADtag位点对应的微型重叠群序列数据(长度200-611 bp)
数据来源
标题为“Data from: Restriction site associated DNA (RAD) for de novo sequencing and marker discovery in sugarcane borer, Diatraea saccharalis Fab. (Lepidoptera: Crambidae)”的研究数据
适用场景
- 甘蔗螟虫进化研究: 利用SNP标记分析种群基因流、遗传结构及进化关系
- 宿主适应性研究: 通过标记数据探究甘蔗螟虫对不同宿主植物的适应机制
- 害虫防控策略研究: 分析标记与抗药性等防控相关性状的关联,支持防控战术优化
- 基因组功能注释: 基于微型重叠群的功能注释结果,研究甘蔗螟虫关键基因功能
- 分子标记开发应用: 利用SNP及微卫星标记开展甘蔗螟虫的分子育种或种群监测