MCF7细胞系靶向药物化学活性数据集-2023-sabetm

MCF7细胞系靶向药物化学活性数据集-2023-sabetm 数据来源:互联网公开数据 标签:MCF7,细胞系,药物发现,QSAR,计算化学,生物活性,药物筛选,药物机制,安全性

数据概述: 本数据集来源于著名的生物活性分子数据库ChEMBL,包含具有药物活性特性的分子信息。数据集中的特征信息来源于ChEMBL的不同表格,包括分子性质、生物活性数据、靶点信息和安全性警告等。本数据集特别聚焦于针对MCF7细胞系进行测试的化合物,MCF7细胞系广泛用于乳腺癌研究。

数据集包括关键的分子描述符(如分子量、LogP、氢键供体和受体数目、极性表面积等)以及重要的生物活性值(如IC50、EC50和Ki),还提供了药物作用机制、药物适应症及潜在安全性问题的见解。

该数据集可作为药物发现、QSAR建模、计算化学中机器学习应用等领域的宝贵资源。

数据用途概述: 该数据集适用于药物发现、QSAR(定量结构-活性关系)建模、计算化学中的机器学习应用等场景。研究者可以利用此数据集进行药物筛选、生物活性预测、药物作用机制分析及安全性评估。该数据集对于推动乳腺癌相关药物的研发具有重要意义。

特征概述: molregno:分子的唯一标识符。 iupac_name:分子的IUPAC名称。 canonical_smiles:分子结构的SMILES表示法。 molecular_weight:化合物的分子量。 alogp:辛醇-水分配系数的对数。 hba:分子中的氢键受体数目。 hbd:分子中的氢键供体数目。 psa:分子的极性表面积。 rtb:分子中的可旋转键数目。 ro3_pass:分子是否通过Rule of 3(药物类性质的评判标准)。 num_ro5_violations:违反Lipinski's Rule of 5的次数。 cx_logp:辛醇-水分配系数的对数。 cx_logd:在特定pH下的分配系数的对数。 molecular_species:分子物种类型(例如,中性、阴离子、阳离子)。 qed_weighted:药物类性质的定量估计。 np_likeness_score:与天然产物相似性的评分。 ic50_value:IC50值,表示化合物的抑制活性。 ic50_units:IC50值的单位。 standard_relation:报告的活性值与实际测量值之间的关系,通常包括=, , ≤, ≥等符号。 target_name:生物靶点的名称。 target_type:生物靶点的类型(例如,酶、受体)。 cell_description:用于检测的细胞系描述。 disease_name:与分子相关的疾病名称。 disease_category:疾病的类别(例如,癌症、心血管)。 mechanism_of_action:药物的作用机制。 action_type:药物的作用类型(例如,激动剂、拮抗剂)。 warning_type:与药物相关的警告类型。 warning_description:警告的描述。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 9.68 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。