EC类混合酶-底物关系预测数据集

EC类混合酶-底物关系预测数据集 数据来源:互联网公开数据 标签:酶学,EC分类,底物预测,机器学习,化学信息,结构信息,数据不平衡 数据概述: 本数据集包含酶-底物关系预测所需的关键信息,涵盖了酶作用于底物时可能涉及的多个EC分类。数据集包括三个CSV文件,分别存储了底物的描述信息、ECFP(扩展连接指纹)和FCFP(功能类连接指纹),这些信息涵盖了化学组成、结构特征及分子间的连接方式。 数据用途概述: 该数据集适用于酶学研究、药物发现及生物化学分析等领域。研究者可以利用这些数据开发机器学习模型,预测底物的EC分类,进而探索酶的作用机制和药物设计策略。同时,由于数据集存在明显的标签不平衡问题,研究者需要开发或选择能够有效处理此类问题的算法,以提高预测的准确性和可靠性。 举例: 通过分析mixed_desc.csv文件中的底物描述信息,结合mixed_ecfp.csv和mixed_fcfp.csv中的结构信息,研究人员可以构建一个多任务学习模型,预测底物可能涉及的多个EC分类,从而更准确地理解酶与底物之间的复杂关系。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.37 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。