数据集概述
本数据集包含939个分子片段在二甲基亚砜(DMSO)中的溶解度实验数据及化学信息学分析结果。通过NMR技术测定实验溶解度,使用ISIDA片段描述符构建支持向量分类模型,识别34个异常值并修正28个,模型5折交叉验证平衡准确率达0.78。数据集包含化学结构及对应溶解度信息,模型可通过指定链接访问。
文件详解
- pict.sdf
- 文件格式:SDF
- 字段映射介绍:包含分子片段的化学结构及在DMSO中1mM标称浓度下的溶解度信息,SDF字段"Comment"(若有)标注可能影响数值的异常事件
- filtered_enamine.sdf
- 文件格式:SDF
- 字段映射介绍:包含类片段有机化合物的化学结构及在DMSO中10mM标称浓度下的溶解度信息,为已发表数据的子集
- pict.xlsx
- 文件格式:XLSX
- 字段映射介绍:对应pict.sdf的表格形式数据,包含分子片段化学结构及1mM标称浓度下的DMSO溶解度信息
- filtered_enamine.xlsx
- 文件格式:XLSX
- 字段映射介绍:对应filtered_enamine.sdf的表格形式数据,包含类片段化合物化学结构及10mM标称浓度下的DMSO溶解度信息
数据来源
infochim.u-strasbg.fr平台
适用场景
- 药物筛选分子溶解度评估:用于分析分子片段在DMSO中的溶解度,筛选适合药物筛选实验的片段
- 化学信息学模型构建:基于实验数据开发或优化分子溶解度预测模型
- 药物研发化合物筛选:为药物研发中早期化合物的溶解度评估提供参考数据
- 实验方法优化:分析NMR测定溶解度的实验异常值,优化实验流程与数据处理方法