-
ChemSearch_Based_原始化合物数据集_2023
2026年1月29日 0 11 7
数据集概述 本数据集为ChemSearch研究的原始数据集,包含分别来源于ChEMBL和PubChem的两个化合物数据集。数据涵盖特定时间节点的化合物SMILES字符串,经随机打乱处理,可用于化学信息检索相关研究。 文件详解 文件名称:Datasets.zip 文件格式:ZIP 字段映射介绍:压缩包内包含两个数据集,分别为:...
-
ChEMBL_Based_激酶抑制剂与支架高置信度活性数据集
2026年1月29日 30 104 92
数据集概述 本数据集基于ChEMBL第18版数据,提供了针对人类激酶组化合物和支架覆盖度评估的高置信度活性数据,包含激酶抑制剂与支架集合,以及不同结构关系、不同混杂程度和高活性抑制剂的支架集合,配套有说明文档。 文件详解 README.txt 文件格式:TXT...
-
ChEMBL_Based_31组人类靶点活性化合物回归建模数据集
2026年1月28日 30 39 17
数据集概述 本数据集从ChEMBL 17版本中筛选出31组化合物数据,用于回归建模。筛选条件包括:针对人类靶点的直接抑制/结合实验、最高ChEMBL置信评分、Ki值低于100微摩尔;相同化合物的多Ki值按数量级平均或剔除;移除重复、泛实验干扰及反应性分子;仅保留至少500个化合物的数据集。 文件详解...
-
ChEMBL_21_Based_化合物活性记录与原始出版物关联数据
2026年1月27日 30 157 74
数据集概述 本数据集源自ChEMBL 21版本,包含两组追溯至原始出版物的化合物活性记录(set 1和set 2),记录了化合物-靶点组合的活性测量值及对应出版物信息,同时提供两组记录的唯一出版物列表,为药物研发领域的化合物活性研究提供结构化数据支持。 文件详解...
-
ChemDiv_ChEMBL_DUD_E_深度学习分子对接研究数据集
2026年1月23日 30 72 43
数据集概述 本数据集为论文《Exploration on Learning Molecular Docking with Deep Learning Models》配套数据,包含ChemDiv聚类化合物、训练集对接分数、DUD-E验证化合物与受体、ChEMBL随机化合物及活性化合物等数据,支撑深度学习分子对接模型的训练与验证。 文件详解...
-
ChEMBL_Based_MMP_cliffs_SAR传输系列_RECAP_MMPs数据集
2026年1月13日 30 121 50
数据集概述 本数据集基于最新版ChEMBL中的化合物,提供三种基于MMP的数据集:活性悬崖(MMP-cliffs)、结构活性关系(SAR)传输系列、基于逆合成规则的第二代MMPs(RECAP-MMPs)。数据以八种文件形式呈现,按靶点和Ki、IC50子集分类,采用规范SMILES表示结构信息。 文件详解 文件名称:mmp_data_sets.zip...
-
整合蛋白质_配体相互作用数据库_IPLID
2025年12月13日 30 90 15
数据集概述 该数据集为整合蛋白质-配体相互作用数据库(IPLID),整合了BindingDB、ChEMBL等多源数据,包含蛋白质-配体相互作用数据(数值或二进制标签)、配体结构相似性(Tanimoto系数)、蛋白质序列相似性等信息,支持机器学习项目检索与基准测试开发。 文件详解 数据压缩包文件:...
-
-
核受体活性数据集_NURA
2025年12月8日 30 143 135
数据集概述 该数据集收集了调节核受体(NRs)的小分子的精选信息,包含15247个分子和11种选定核受体的生物活性注释,用于药理学和毒理学应用,是现有相关数据库的整合与扩展。 文件详解 核心数据文件: Nura_v1.0.0.csv:CSV格式,包含每个分子(行,以唯一ID和规范SMILES字符串标识)和每个核受体端点(列)的活性标签...
-
儿童急性淋巴细胞白血病药物重定位的蛋白质与配体数据集
2025年11月28日 30 79 58
数据集概述 本数据集包含蛋白质序列和配体数据两部分,用于儿童急性淋巴细胞白血病(ALL)的药物重定位计算研究。蛋白质序列来自UniProt数据库,配体数据来自ChEMBL、DrugBank及手动补充的FDA批准药物,支持生物信息学、药物发现等领域研究。 文件详解 数据集目录: Protein and Ligand Dataset for Drug...
-
具有人类病原体分子靶点药理干预潜力的肽数据库
2025年11月27日 30 132 127
数据集概述 本数据集包含针对细菌、病毒、寄生虫和真菌等病原体的抗菌肽数据库,通过PubChem和ChEMBL获取肽的SMILES结构,经OpenBabel转换为一维SMI、三维MOL2和PDB格式,共七百一十八条具有抑制活性的肽,支持病原体分子靶点相关研究。 文件详解 该数据集由多个目录和文件组成,具体说明如下: - 补充资料文件: -...



