数据集概述
本数据集包含6个Excel文件,围绕Pharmulator™模块在药物设计中的应用展开,内容涵盖训练集与测试集的SMILES编码及GHS分类、8993种化学品的水溶性参数与结构描述符、2356种药物分子的DrugBank ID及功能基团信息,以及不同训练集和测试集的功能基团、Morgan和MACCS描述符数据,为药物设计中功能基团量化研究提供支持。
文件详解
- MS-Excel-1.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含训练集和测试集的SMILES编码,以及对应的GHS分类信息
- MS-Excel-2.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含8993种化学品的SMILES编码、实验性水溶性参数、功能基团(FGs)、基于Morgan和MACCS的结构描述符值
- MS-Excel-3.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含2356种药物分子的DrugBank ID、SMILES编码、功能基团出现次数(二进制字符串)
- MS-Excel-4.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含整个训练集、平衡训练集和最终测试集的SMILES编码及功能基团描述符
- MS-Excel-5.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含整个训练集、平衡训练集和最终测试集的SMILES编码及Morgan描述符
- MS-Excel-6.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含整个训练集、平衡训练集和最终测试集的SMILES编码及MACCS描述符
适用场景
- 药物设计研究: 利用功能基团量化数据优化药物分子结构设计
- 化学品水溶性预测: 通过实验性水溶性参数与结构描述符分析化学品水溶性规律
- 药物分子功能基团分析: 基于DrugBank药物分子的功能基团信息研究其结构-活性关系
- 药物设计模型训练: 利用训练集和测试集的描述符数据构建药物设计相关预测模型
- 结构描述符应用研究: 对比分析功能基团、Morgan和MACCS三种描述符在药物设计中的应用效果