数据集概述
该数据集包含使用nf-core/sarek v3.1.1流程在基准测试数据集上生成的全外显子组测序(WES)变异检测结果,涵盖不同样本、覆盖度和变异检测工具的输出文件及报告。
文件详解
- 变异检测结果文件(.gz格式):
- 包含12个压缩的VCF文件,如WES_agilent_low_cov_sarek311_NA12878_strelka.vcf.gz、CHN_ERR1341796_sarek311_freebayes.vcf.gz等,记录不同样本(如NA12878、CHN_ERR1341796)、覆盖度(高/低)、捕获平台(Agilent、Twist)和变异检测工具(Strelka、FreeBayes、HaplotypeCaller)的变异数据
- 报告文件(.html格式):
- 包含9个HTML报告,如WES_high_low_coverage_agilent_execution_report_sarek311.html、CHN_sarek311_multiqc_report.html等,涵盖流程执行报告和MultiQC汇总报告
适用场景
- 生物信息学流程评估:对比不同变异检测工具在WES数据上的性能差异
- 测序数据分析优化:分析覆盖度、捕获平台对变异检测结果的影响
- 基准测试研究:验证nf-core/sarek v3.1.1流程在临床或科研WES数据中的应用效果
- 变异检测方法学研究:支撑全外显子组测序变异分析的方法学比较与改进