分子相似性预测数据集

分子相似性预测数据集 数据来源:互联网公开数据 标签:分子相似性,化学,机器学习,结构-活性关系,孤儿药物,分子描述符,2D图像,3D图像

数据概述: 本数据集包含了200个实例,用于评估分子间的相似性。数据集由两部分组成:原始数据集和新数据集。每部分数据包括分子的相似性评估、SMILES表示、分子描述符,以及2D和3D图像。原始数据集中的分子经过标准化处理,使其与新数据集中的分子一致。数据集适用于机器学习模型的训练和评估,特别是在分子相似性感知领域。

数据用途概述: 该数据集可用于开发和评估机器学习模型,以自动化和辅助人类在分子相似性评估中的工作。数据集中的分子描述符和图像信息有助于模型理解分子结构与其相似性之间的关系。此数据集还适用于药物化学研究,特别是在结构-活性关系分析和孤儿药物评估方面。此外,数据集也适合用于教育培训,帮助学习者理解和应用分子相似性概念。

举例: 数据集中包含两个CSV文件,分别存储了分子的相似性评估和SMILES表示。此外,还提供了分子的2D和3D图像,供专家进行相似性评价。数据集中的分子描述符通过RDKit、MolVS、KNIME、OpenEye Omega和ROCS等工具计算得出。数据集没有缺失值,所有分子的SMILES表示都经过了标准化处理。研究者可以利用该数据集训练分类模型,预测分子之间的相似性。相关的研究论文《基于机器学习模型的分子相似性感知》由Enrico Gandini等人发表在《国际分子科学杂志》上。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.56 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。