数据集概述
本数据集支撑药物性肝损伤(DILI)预测研究,包含1241种化合物的分子指纹信息及肝毒性标注,通过集成学习方法构建预测模型。数据覆盖模型训练验证所需的化合物结构与毒性关联信息,可用于药物研发阶段的肝毒性风险评估,共含4个补充表格文件。
文件详解
- 文件名称:Supplementary_Table_1.csv
- 文件格式:CSV
- 字段映射介绍:包含化合物相关数据,具体字段及内容需结合研究背景解析(预览显示含XML相关字符,可能为结构化数据存储)
- 文件名称:Supplementary_Table_2.csv
- 文件格式:CSV
- 字段映射介绍:包含Smiles(化合物结构编码)、Hepatotoxicity(肝毒性标注)字段,记录化合物分子结构与肝毒性关联信息
- 文件名称:Supplementary_Table_3.xlsx
- 文件格式:XLSX
- 字段映射介绍:补充表格数据,具体内容未明确预览,推测为研究相关的辅助分析数据
- 文件名称:Supplementary_Table_4.xlsx
- 文件格式:XLSX
- 字段映射介绍:补充表格数据,具体内容未明确预览,推测为模型性能评估或分子特征分析相关数据
数据来源
论文“Predicting drug-induced liver injury using ensemble learning methods and molecular fingerprints”
适用场景
- 药物研发肝毒性预测:基于化合物分子指纹预测肝损伤风险,辅助药物早期安全性筛选
- 机器学习模型训练:用于构建和验证集成学习肝毒性预测模型,优化算法性能
- 分子结构-毒性关联研究:分析化合物结构特征与肝毒性的相关性,识别肝损伤相关分子亚结构
- 药物安全评估:为药物研发企业提供化合物肝毒性风险评估的数据支持,降低研发失败率