数据集概述
本数据集包含PRISM模型对英国生物银行(UK Biobank)70种可遗传性状的遗传变异效应预测结果,标注了变异-性状关联的直接效应、垂直多效性或混杂多效性类型。数据记录每个变异-性状效应的基因组坐标、P值、多效性分类及原始GWAS统计量,支持遗传关联机制研究。
文件详解
- AllSigVariants.csv
- 文件格式:CSV
- 字段映射介绍:包含variant_hg19(hg19基因组变异坐标)、rsid(变异rs编号)、Pval_PRISM(PRISM计算的P值)、FullPleio(详细多效性类型)、SynthPleio(多效性类型摘要)、Pval_GWASUKBB(UKBB GWAS原始P值)、Trait_UKBB(UKBB性状编码)、TraitName_UKBB(UKBB性状名称)字段。
- UKBiobank_Traits_Description.csv
- 文件格式:CSV
- 字段映射介绍:包含Category(性状类别)、Trait Code in UK Biobank(UKBB性状编码)、Description of the trait in UK Biobank(性状描述)、Trait name(性状名称)、Sample size(样本量)字段。
- LHCMR_Results.zip
- 文件格式:ZIP(压缩包)
- 内容说明:包含LHC-MR分析结果数据(v3版本新增)。
- eGenes_enrichment.zip
- 文件格式:ZIP(压缩包)
- 内容说明:包含eGenes富集分析相关数据。
数据来源
UK Biobank;PRISM项目(参考论文https://www.medrxiv.org/content/10.1101/2024.06.01.24308193及GitHub仓库https://github.com/martintnr/PRISM)
适用场景
- 遗传关联机制研究:分析变异-性状关联的直接效应与多效性类型,解析复杂疾病遗传机制。
- 可遗传性状遗传基础分析:基于UK Biobank 70种性状数据,探究遗传变异对表型的影响模式。
- 多效性分类验证:验证PRISM模型对垂直多效性、混杂多效性的预测准确性,优化多效性识别算法。
- 遗传流行病学研究:结合原始GWAS统计量,评估变异-性状关联的潜在临床应用价值。
- 生物信息学方法开发:利用标注数据训练或验证新的遗传变异-性状关联预测模型。