PRISM_UK_Biobank_遗传变异_性状效应预测与标注完整结果数据v4

数据集概述

本数据集包含PRISM模型对英国生物银行(UK Biobank)70种可遗传性状的遗传变异效应预测结果,标注了变异-性状关联的直接效应、垂直多效性或混杂多效性类型。数据记录每个变异-性状效应的基因组坐标、P值、多效性分类及原始GWAS统计量,支持遗传关联机制研究。

文件详解

  • AllSigVariants.csv
  • 文件格式:CSV
  • 字段映射介绍:包含variant_hg19(hg19基因组变异坐标)、rsid(变异rs编号)、Pval_PRISM(PRISM计算的P值)、FullPleio(详细多效性类型)、SynthPleio(多效性类型摘要)、Pval_GWASUKBB(UKBB GWAS原始P值)、Trait_UKBB(UKBB性状编码)、TraitName_UKBB(UKBB性状名称)字段。
  • UKBiobank_Traits_Description.csv
  • 文件格式:CSV
  • 字段映射介绍:包含Category(性状类别)、Trait Code in UK Biobank(UKBB性状编码)、Description of the trait in UK Biobank(性状描述)、Trait name(性状名称)、Sample size(样本量)字段。
  • LHCMR_Results.zip
  • 文件格式:ZIP(压缩包)
  • 内容说明:包含LHC-MR分析结果数据(v3版本新增)。
  • eGenes_enrichment.zip
  • 文件格式:ZIP(压缩包)
  • 内容说明:包含eGenes富集分析相关数据。

数据来源

UK Biobank;PRISM项目(参考论文https://www.medrxiv.org/content/10.1101/2024.06.01.24308193及GitHub仓库https://github.com/martintnr/PRISM)

适用场景

  • 遗传关联机制研究:分析变异-性状关联的直接效应与多效性类型,解析复杂疾病遗传机制。
  • 可遗传性状遗传基础分析:基于UK Biobank 70种性状数据,探究遗传变异对表型的影响模式。
  • 多效性分类验证:验证PRISM模型对垂直多效性、混杂多效性的预测准确性,优化多效性识别算法。
  • 遗传流行病学研究:结合原始GWAS统计量,评估变异-性状关联的潜在临床应用价值。
  • 生物信息学方法开发:利用标注数据训练或验证新的遗传变异-性状关联预测模型。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 170.57 MiB
最后更新 2026年1月20日
创建于 2026年1月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。