数据集概述
本数据集包含激酶融合蛋白的AlphaFold预测结构数据,核心围绕其广泛存在的扩展β-指基序展开。数据涵盖结构模型文件与置信度统计文件,可用于分析激酶融合蛋白的结构特征及相关生物信息学研究,总计包含六十个文件。
文件详解
- .json文件(40个)
- 文件名称示例:ukh47142_full_data.json、qrv07410_summary_confidences.json
- 文件格式:JSON
- 字段映射介绍:summary_confidences.json文件包含'chain_iptm'(链置信度)、'chain_pair_iptm'(链对置信度)、'chain_pair_pae_min'(链对最小预测对齐误差)、'chain_ptm'(链预测模板匹配度)、'fraction_disordered'(无序区域占比)、'has_clash'(是否存在结构冲突)、'iptm'(综合置信度)、'num_recycles'(循环次数)、'ptm'(预测模板匹配度)、'ranking_score'(排序得分)等结构置信度统计字段;full_data.json文件为完整数据文件
- .cif文件(20个)
- 文件名称示例:qem39042_model.cif、qqy96576_model.cif
- 文件格式:CIF
- 字段映射介绍:包含激酶融合蛋白的AlphaFold预测结构模型数据
适用场景
- 蛋白质结构特征分析: 研究激酶融合蛋白中扩展β-指基序的结构特点及分布规律
- 结构置信度评估: 利用.json文件中的iptm、ptm等指标分析AlphaFold预测结构的可靠性
- 激酶融合蛋白功能研究: 结合结构模型探究激酶融合蛋白的构象与生物功能的关联
- 生物信息学结构预测验证: 对比不同激酶融合蛋白的预测结构数据,验证AlphaFold在该类蛋白中的预测性能