数据集

PREDICT药物重定位数据集

数据集概述

本数据集为药物重定位研究提供支持，包含药物-疾病关联矩阵及多种药物-药物、疾病-疾病相似性矩阵。关联矩阵记录药物与疾病的正负关联状态，相似性矩阵基于副作用、基因签名等特征构建，数据结构参考Gottlieb等2011年研究，稀疏度为百分之零点三八。

文件详解

该数据集包含五个CSV格式文件，具体说明如下： - 药物-疾病关联矩阵 - 文件名称: ratings_mat.csv - 文件格式: CSV - 字段说明: 行表示药物（DrugBank ID或PubChem CID），列表示疾病（MedGen Concept ID）；值为{-1,0,1}，-1为负关联（药物治疗失败）、1为正关联（药物有效）、0为未知状态 - 药物-药物相似性矩阵 - 文件名称: se_PREDICT_matrix.csv - 文件格式: CSV - 字段说明: 行和列均为药物（DrugBank ID或PubChem CID）；值为基于药物副作用one-hot编码的Jaccard相似度得分 - 文件名称: signature_PREDICT_matrix.csv - 文件格式: CSV - 字段说明: 行和列均为药物（DrugBank ID或PubChem CID）；值为基于CREEDS或LINCS L1000数据库药物基因签名的Jaccard相似度得分 - 疾病-疾病相似性矩阵 - 文件名称: disease_semantic_PREDICT_matrix.csv - 文件格式: CSV - 字段说明: 行和列均为疾病（MedGen Concept ID）；值为基于HPO数据库疾病本体节点的Resnik语义相似度 - 文件名称: disease_phenotype_PREDICT_matrix.csv - 文件格式: CSV - 字段说明: 行和列均为疾病（MedGen Concept ID）；值为基于CREEDS数据库疾病表型基因活性变化向量的Jaccard相似度得分

数据来源

Dr. Clémence Réda（clemence.reda@uni-rostock.de）

适用场景

药物重定位研究: 挖掘现有药物的潜在新适应症
药物-疾病关联预测: 基于相似性矩阵构建模型预测未知关联状态
药物副作用分析: 研究药物副作用相似性与治疗效果的关系
疾病表型研究: 分析疾病语义及基因表达特征的相似性模式
计算药理学建模: 为药物研发中的机器学习模型提供训练数据

数据与资源

8087306.zipZIP
1.35 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	1.35 MiB
最后更新	2025年12月8日
创建于	2025年12月8日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。