数据集概述
该数据集包含使用Genomestrip/2.0工具,对黑腹果蝇(D.melanogaster)Sussex LHM半克隆系及一个内部参考系个体的基因组结构变异进行检测与基因分型的代码、日志、数据及摘要。数据涵盖原始与过滤后的CNV结果、提交至NCBI dbVAR的变异文件等,为相关基因组研究提供支持。
文件详解
- 代码文件:
- gs_code.zip: ZIP格式压缩包,包含用于基因组结构变异检测与基因分型的代码文件
- 日志文件:
- gs_logs.zip: ZIP格式压缩包,包含分析过程中的日志记录文件
- 参考数据文件:
- gs_reference_data.zip: ZIP格式压缩包,包含Genomestrip所需的额外输入文件,包括一个用于生成部分文件的shell脚本
- 摘要数据文件:
- gs_summary_data.zip: ZIP格式压缩包,包含分析结果的摘要数据文件
- 原始CNV结果文件:
- lhm_gs.cnvs.raw.vcf.gz: GZIP压缩的VCF格式文件,包含未过滤的CNV流程结果
- 过滤后CNV结果文件:
- filtered.goodS.lhm_gs.cnvs.raw.vcf.gz: GZIP压缩的VCF格式文件,包含去除不良样本后的过滤CNV结果
- NCBI dbVAR提交文件:
- lhm_sx16.dbVAR.vcf.gz: GZIP压缩的VCF格式文件,包含提交至NCBI dbVAR的过滤CNV及来自HaplotypeCaller方法的>50bp插入缺失变异
- Genomestrip输入文件:
- gstrip_lhm_RG_bams.list: LIST格式文件,为Genomestrip的输入文件,指示BAM文件名称及路径
适用场景
- 基因组结构变异研究: 用于分析黑腹果蝇基因组中结构变异的分布与特征
- 生物信息学方法验证: 可作为验证基因组结构变异检测工具性能的测试数据集
- 进化生物学研究: 助力探究实验室适应果蝇种群的基因组变异演化规律
- 分子遗传学分析: 支持与黑腹果蝇特定性状相关的结构变异关联分析