-
pLMs_Evolutionary_Information_蛋白质语言模型进化信息数据集
2026年1月13日 30 49 24
数据集概述 本数据集用于测试进化信息与蛋白质语言模型嵌入结合对二级结构预测的影响,以PDB结构为真值,经PDBredo DB和CATH交叉验证,包含296,596条蛋白质链序列,分TEST100、VAL100、TRAIN6727三个子集,提供序列、二级结构注释、无序区域标注、MSA、PSSM及元文件等资源。 文件详解 验证集注释文件...
2026年1月13日 30 49 24