多模态生物医学药物相互作用数据集_MUDI

数据集概述

该数据集是用于理解药效动力学药物相互作用的多模态生物医学数据集,包含药物对标签数据、分子图像、分子图及药物元信息,支持多模态模型开发与基准测试,聚焦药效动力学视角下的药物相互作用预测。

文件详解

  • 数据集文件(dataset/目录)
  • train.csv:CSV格式,包含训练用带标签药物相互作用对,字段为Drug1(药物1唯一标识)、Interaction(药效动力学类别:协同作用/拮抗作用/新效应)、Drug2(药物2唯一标识)
  • test.csv:CSV格式,包含测试用带标签药物相互作用对,字段与train.csv一致
  • 分子表示文件(molecules/目录)
  • images/[drug_id].png:PNG格式,1000×800像素,药物2D结构图像,对应SMILES表示
  • graphs/[drug_id].graphml:GraphML格式,药物分子图,节点为原子、边为化学键,需用NetworkX等库读取
  • 药物元信息文件
  • drug_info.json:JSON格式,包含各药物的名称、描述(摘要/适应症/代谢/作用机制/药效动力学)、分子式、SMILES等信息

适用场景

  • 药效动力学研究:分析药物间协同、拮抗及新效应等相互作用机制
  • 多模态模型开发:构建融合文本、图像、分子图特征的药物相互作用预测模型
  • 药物安全评估:预测药物组合的潜在新不良反应风险
  • 计算生物学应用:探索分子结构与药物相互作用的关联规律
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 51.78 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。