数据集概述
本数据集为曲霉属生物活性代谢物NO抑制QSAR模型研究的补充材料,包含分子数据、模型参数、虚拟筛选结果、可视化图表及KNIME工作流文件,支撑基于集成机器学习技术的抗炎药物预测研究,为计算驱动的新药研发提供数据基础。
文件详解
- 分子数据文件:
- Supplementary Table S1_Database with 101 Molecules with NO inhibition activity.xlsx:Excel格式,含101个具有NO抑制活性的分子数据库
- Supplementary Table S3 Dataset with 99 molecules.csv:CSV格式,含99个分子数据,字段包括row ID、分子名称、TDB07i等分子描述符、IC50、pIC50及分类标签
- train_csv_16-08.csv:CSV格式,训练集数据文件
- 模型参数与结果文件:
- Supplementary_Table S4_Hyperparameter.doc:Word格式,超参数相关表格
- Supplementary_Table S5Hyperparameters tuned_ensemble.docx:Word格式,集成模型调优后的超参数
- Supplementary_Table S7 Metrics for Regression models.docx:Word格式,回归模型性能指标
- Supplementary Table S9 Residual.csv:CSV格式,残差数据,含分子名称、杠杆值、标准化残差
- 虚拟筛选文件:
- Supplementary Table S8 Virtual Screening Prediction.xlsx:Excel格式,虚拟筛选预测结果
- Supplementary Table S6 Virtual Screening Prediction .xlsx:Excel格式,虚拟筛选预测结果
- 可视化图表:
- Figure S1.tiff、Figure S2.jpg、Figure S3.tiff、Figure S4.tiff、Figure S5.tiff:TIFF/JPG格式的补充图表
- 工作流文件:
- KNIME_Classification Aspergillus Descriptors.knwf:KNIME工作流文件,用于曲霉描述符分类
适用场景
- 计算药物化学研究:用于QSAR模型构建与抗炎代谢物预测
- 机器学习应用:验证集成学习(Rotation Forest、AdaBoost)在分子活性预测中的性能
- 药物研发:通过虚拟筛选识别潜在抗炎药物分子
- 分子生物学研究:分析分子描述符与NO抑制活性的关联机制