数据集概述
本数据集包含全基因组关联分析(GWAS)相关的代码、数据、图表及文档文件,涉及连锁不平衡(LD)分析、变异效应预测(VEP)、曼哈顿图与QQ图绘制等内容,为GWAS实验结果的统计分析与可视化提供支持。
文件详解
该数据集包含14个文件,按类型分组说明如下:
- 代码文件(.r格式,共5个):
- 1.info_scores.R、3.manhat_high_qual.R、2.plot_grm_case_control.R、weighted_z.R、LD_vep.R:用于GWAS分析的R语言脚本,涉及信息评分计算、曼哈顿图绘制、广义遗传率矩阵可视化、加权Z检验及连锁不平衡分析等功能
- 数据文件(共5个):
- LD_vep.tsv、LD_vep.csv_with_R2_Pval.tsv、cohort.filt.group.case_control.loco.mlma_LDassoc.tsv:TSV格式数据文件,包含RS编号、变异位置、等位基因、功能后果等GWAS相关字段
- lawless2025spss_gwas_tables.xlsx、LD_vep.xlsx:Excel格式表格,存储GWAS分析结果数据
- 图表文件(.png格式,共2个):
- 5.case_control.png、6.case_control-QQ.png:GWAS分析相关的可视化图表,包括病例对照曼哈顿图和QQ图
- 压缩文件(共2个):
- SHCS.QC_chr9.pos96347718-101347219.impute2_snptest_score.zip:压缩的基因型数据文件
- cohort.filt.group.case_control.loco.mlma.printed.sig.gz:压缩的显著关联结果文件
适用场景
- 基因组学研究:用于GWAS实验中变异位点的功能注释与连锁不平衡分析
- 生物统计学分析:支持病例对照研究中的统计检验与结果可视化
- 遗传流行病学研究:探究遗传变异与疾病表型的关联
- 生物信息学方法验证:验证GWAS分析流程中的代码脚本与数据处理逻辑