天然产物作为色氨酸2_3_双加氧酶抑制剂的计算筛选数据集

数据集概述

该数据集为天然产物作为色氨酸2,3-双加氧酶抑制剂的计算筛选研究数据,包含基于CNN的QSAR模型、分子对接、ADMET分析及分子动力学模拟相关的模型文件、数据文件和可视化结果,支持抑制剂筛选的计算分析。

文件详解

该数据集包含19个文件,按类型分类如下: - 数据文件(CSV格式,共12个): - bioactivity_data_processed.csv、bioactivity_data_balanced_standardized.csv:处理后的生物活性数据文件 - morgan_fingerprints.csv、morgan_fp_selected.csv:分子指纹数据文件 - mrd-filtered.csv:筛选后的分子特性数据,包含SMILES、ID、分子量、cLogP等字段 - cnn_model_log.csv:CNN模型训练日志,包含epoch、accuracy、loss等训练指标 - 模型文件(GZ压缩格式,共5个): - cnn.pkl.gz、svm.pkl.gz、xgb.pkl.gz、rf.pkl.gz、knn.pkl.gz:不同机器学习模型的保存文件 - 可视化文件(PNG格式,共2个): - plot_roc_test_set.png、plot_roc_holdout_set.png:ROC曲线可视化结果

适用场景

  • 药物发现研究:天然产物作为色氨酸2,3-双加氧酶抑制剂的虚拟筛选
  • 计算生物学分析:基于QSAR模型的分子活性预测
  • 机器学习应用:评估CNN、SVM等模型在药物筛选中的性能
  • 药物研发支持:ADMET特性分析及分子动力学模拟结果验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 164.24 MiB
最后更新 2025年12月13日
创建于 2025年12月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。