化合物性质预测数据集CompoundPropertyPrediction-user2333
数据来源:互联网公开数据
标签:化合物, 药理学, 分子描述符, ADMET, 机器学习, 结构-活性关系, 数据挖掘, 毒性预测
数据概述:
该数据集包含来自公开数据库的化合物相关数据,记录了化合物的结构信息、分子描述符以及ADMET性质预测值。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态化合物性质数据集。
地理范围:数据覆盖范围不限,化合物结构及性质具有普适性。
数据维度:数据集包含以下关键数据:SMILES字符串(化合物的简化分子线性输入规范)、Caco-2(细胞渗透性)、CYP3A4(细胞色素P450 3A4抑制)、hERG(心脏毒性)、HOB(人吸收,分布,代谢和排泄)和MN(致突变性)等ADMET性质的预测结果,以及ALogP、ALogp2、nS等分子描述符。
数据格式:数据集以CSV格式提供,其中包含ADMET预测结果的CSV文件(ADMETcsv)和分子描述符的CSV文件(Molecular_Descriptor_PartAcsv),以及一个pkl文件(fea_dict_PartCpkl)。
数据来源:数据来源于化学、药理学等相关领域的公开数据库,经过了标准化处理。
该数据集适合用于药物研发、药理学研究和ADMET性质预测等领域。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于药物设计、药效团分析、毒性预测等领域的学术研究,如基于结构的药物性质预测、结构-活性关系(SAR)研究等。
行业应用:可用于药物研发公司和CRO(合同研究组织)进行先导化合物的筛选、ADMET性质预测、药物代谢动力学研究等。
决策支持:支持药物研发过程中的早期筛选和优化,帮助决策者选择具有更好ADMET性质的候选药物。
教育和培训:作为药物化学、药理学、计算机辅助药物设计(CADD)等课程的实训材料,帮助学生理解化合物结构与性质之间的关系,以及预测模型的构建。
此数据集特别适合用于探索化合物结构与药理性质之间的关联,构建预测模型,从而加速药物研发过程,提高研发效率。