数据集概述
本数据集为论文“BRCA1-specific machine learning model predicts variant pathogenicity with high accuracy”的补充材料,包含3幅补充图表和3张补充表格,涉及BRCA1错义变异分布、模型Shapely值分析、ROC曲线验证、交叉验证结果及未审核变异的致病性预测等内容,支持对BRCA1特异性机器学习模型的性能评估与结果解读。
文件详解
- 文件名称:Supplementary Figures_v2.docx
- 文件格式:DOCX
- 字段映射介绍:包含3幅补充图表,具体为:Figure S1(141个已审核BRCA1错义变异的分布)、Figure S2(BRCA1 XGBoost模型的Shapely值)、Figure S3(用于预测意义未明变异功能实验结果的BRCA1 XGBoost模型Shapely值)。
- 文件名称:Supplementary Tables_BRCA1_PG.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含3张补充表格,具体为:Table S1(不同计算机预测方法的ROC曲线分析)、Table S2(BRCA1模型在5组随机训练和测试样本中的交叉验证结果)、Table S3(BRCA Exchange数据库中31058个未审核BRCA1变异的致病性预测与优先级排序)。
数据来源
论文“BRCA1-specific machine learning model predicts variant pathogenicity with high accuracy”
适用场景
- 生物信息学模型评估: 利用ROC曲线分析和交叉验证数据,验证BRCA1特异性机器学习模型的预测性能。
- 变异致病性研究: 通过未审核变异的预测结果,辅助BRCA1意义未明变异的致病性优先级排序。
- 模型解释性分析: 基于Shapely值图表,探究模型特征对BRCA1变异致病性预测的贡献度。
- 医学遗传学应用: 结合错义变异分布数据,支持BRCA1相关疾病的遗传风险评估研究。