ChEMBL_Based_31组人类靶点活性化合物回归建模数据集

数据集概述

本数据集从ChEMBL 17版本中筛选出31组化合物数据,用于回归建模。筛选条件包括:针对人类靶点的直接抑制/结合实验、最高ChEMBL置信评分、Ki值低于100微摩尔;相同化合物的多Ki值按数量级平均或剔除;移除重复、泛实验干扰及反应性分子;仅保留至少500个化合物的数据集。

文件详解

  • 文件名称:DataSets_SVR_modeling.zip
  • 文件格式:ZIP(压缩包)
  • 字段映射介绍:压缩包内包含31组符合筛选条件的化合物数据集,SD文件中含"pKi"字段(需注意该字段为nM单位的Ki值,非对数值),数据集用于支持回归建模任务。

数据来源

ChEMBL version 17

适用场景

  • 药物靶点活性预测: 基于化合物Ki值数据构建回归模型,预测新化合物对人类靶点的抑制/结合活性。
  • 化学信息学模型训练: 用于支持SVR等回归算法的模型开发与验证,优化药物发现流程。
  • 化合物筛选标准研究: 分析筛选条件(如Ki值阈值、置信评分)对数据集质量及模型性能的影响。
  • 药物研发数据标准化: 为药物研发领域的化合物活性数据标准化处理提供参考案例。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.56 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。