蛋白质野生型预测数据集

蛋白质野生型预测数据集 数据来源:互联网公开数据
标签:蛋白质结构预测,AlphaFold,野生型,置信度评估,生物信息学,结构生物学,深度学习

数据概述:
本数据集包含AlphaFold(AF)对1186个蛋白质结构的预测结果,涵盖了73个野生型蛋白质。数据集由多个文件组成,包括:
1. CIF文件夹:包含蛋白质的原子坐标及其元数据,用于描述预测的蛋白质结构。
2. 置信度文件夹:包含AlphaFold输出的pLDDT值,用于评估每个残基的局部结构置信度。
3. 错误文件夹:包含AlphaFold输出的PAE值,用于评估每对残基的相对位置置信度。
4. CSV文件:包括野生型序列列表和AF预测结果的详细信息,如序列ID和对应的预测结果。

数据用途概述:
该数据集适用于蛋白质结构预测、预测模型评估、生物医学研究等多种场景。研究人员可利用CIF文件进行蛋白质结构分析;通过pLDDT和PAE值评估预测的置信度;利用CSV文件进行序列与结构的关联研究。此外,数据集还可用于机器学习模型的训练与验证,支持新药开发、酶工程设计以及结构生物学研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 87.91 MiB
最后更新 2025年4月24日
创建于 2025年4月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。