Redocking_PDB_Based_蛋白质配体结合位点分子对接实验数据集

数据集概述

本数据集是论文《Redocking the PDB》的补充数据,包含PDBScan22和PDBScan22-HQ两个核心数据集,以及配体、结合位点的属性数据和JAMDA、AutoDock Vina等工具的分子对接结果。数据以CSV格式存储并附JSON元数据,符合CSV on the web标准,支持蛋白质-配体对接算法的性能评估与分析。

文件详解

  • 核心数据集文件
  • PDBScan22.csv:PDBScan22数据集主文件,包含322,051个大分子-配体结合位点基础信息,格式CSV
  • PDBScan22-HQ.csv:PDBScan22-HQ高质量数据集,包含21,355个通过结构质量过滤的结合位点,格式CSV
  • PDBScan22-HQ-ADV-Success.csv:PDBScan22-HQ子集,剔除AutoDock Vina失败的336个结合位点,格式CSV
  • PDBScan22-HQ-Macrocycles.csv:PDBScan22-HQ子集,仅包含含至少10原子大环分子的结合位点,格式CSV
  • 属性数据文件
  • PDBScan22_ligand_properties.csv:PDBScan22配体的构象无关属性,格式CSV
  • PDBScan22_StructureProfiler_quality_descriptors.csv:PDBScan22结合位点的结构质量描述符,格式CSV
  • PDBScan22_basic_complex_properties.csv:PDBScan22结合位点的基础复合物属性,格式CSV
  • PDBScan22-HQ_DoGSite3_pocket_descriptors.csv:PDBScan22-HQ结合位点的口袋描述符,格式CSV
  • PDBScan22-HQ_molecule_types.csv:PDBScan22-HQ配体的分子类型分类(药物样、片段样等),格式CSV
  • 对接结果文件
  • 通用规则:每个对接实验包含主结果文件(如PDBScan22_JAMDA_NL_NR.csv)和构象结果文件(如PDBScan22_JAMDA_NL_NR_poses.csv),主文件记录对接运行概况,构象文件记录每个构象的得分与RMSD值,格式均为CSV
  • 示例文件:PDBScan22-HQ_JAMDA_NL_NR.csv(JAMDA在PDBScan22-HQ上的对接概况)、PDBScan22-HQ_AutoDockVina_poses.csv(AutoDock Vina在PDBScan22-HQ上的构象结果)
  • 共识评分结果文件
  • PDBScan22-HQ_JAMDA_NW_NR_Consensus.csv:JAMDA与AutoDock Vina的共识评分概况,格式CSV
  • PDBScan22-HQ_JAMDA_NW_NR_Consensus_poses.csv:无优化的共识评分构象结果,格式CSV
  • PDBScan22-HQ_JAMDA_NW_NR_ConsensusOpt_poses.csv:带优化的共识评分构象结果,格式CSV

数据来源

论文“Redocking the PDB” by Flachsenberg et al.(DOI: 10.1021/acs.jcim.3c01573)

适用场景

  • 分子对接算法性能评估:对比JAMDA、AutoDock Vina等工具在不同数据集上的对接精度与效率
  • 配体-结合位点属性关联分析:探究配体分子属性、结合位点结构特征与对接结果的相关性
  • 分子类型特异性研究:分析不同分子类型(如大环分子)的对接难点与优化方向
  • 药物研发辅助:通过高质量对接数据筛选潜在药物分子的结合模式,支持药物设计
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 996.44 MiB
最后更新 2026年1月25日
创建于 2026年1月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。