数据集概述
本数据集包含DGRP黑腹果蝇基因型从旧版本向参考基因组v6.0转换的结果,涵盖VCF和PLINK格式基因型文件、转换运行代码、日志文件、统计摘要及质控图表,用于展示SNP位置变化情况。
文件详解
- 基因型数据文件:
- dgrp2_dm6_dbSNP.vcf.gz:压缩VCF格式基因型文件
- dgrp2_dm6_dbSNP.vcf.bed、.bim、.fam:PLINK格式基因型文件
- dgrp2_dm6_dbSNP.vcf.idx:VCF文件索引
- 转换工具与代码:
- mod_dm3ToDm6.over.chain、rep.mod_dm3ToDm6.over.chain:基因组转换链文件
- drive_liftover.sh:Bash转换执行脚本
- check_liftover.R:R语言质控脚本
- vcfsorter.pl:VCF排序脚本
- 日志与统计文件:
- log_drive_liftover.txt、log_sh_check_liftover.txt等:转换过程日志
- variant_counts.txt:变异计数统计文件
- 图表文件:
- figure_dgrp_liftover_results.png:转换结果图表
- figure_hoskins_melanogaster_genone_versions.png:基因组版本对比图表
适用场景
- 基因组学研究:分析黑腹果蝇基因型在不同参考基因组版本间的位置转换
- 基因型数据质控:验证基因型转换准确性及SNP位置变化情况
- 生物信息学方法复现:基于提供的代码复现基因型转换流程
- 变异数据分析:利用VCF和PLINK文件进行后续关联分析或群体遗传学研究