Pickaxe_Based_SMILES扩展天然产物分类器及训练模型数据

数据集概述

本数据集包含Pickaxe增强的SMILES数据集、使用该数据集训练的第一版和第二版Keras模型,以及类别、通路和超类别名称文件,用于确保模型预测结果的正确解读,共7个文件。

文件详解

  • 模型文件
  • 文件名称:second_edition.keras、model_checkpoint_0.keras
  • 文件格式:.keras
  • 字段映射介绍:使用Pickaxe增强SMILES数据集训练的Keras模型文件,包含模型结构与训练参数
  • 名称映射文件
  • 文件名称:pathway_names.json、class_names.json、superclass_names.json
  • 文件格式:.json
  • 字段映射介绍:pathway_names.json为长度7的数组(样本值Alkaloids);superclass_names.json为长度69的数组(样本值Alkylresorsinols);class_names.json为类别名称映射文件
  • 增强SMILES数据集
  • 文件名称:pickaxe.json.gz
  • 文件格式:.json.gz
  • 字段映射介绍:Pickaxe生成的增强SMILES数据集压缩文件
  • 标量文件
  • 文件名称:second_edition_scalers.pkl
  • 文件格式:.pkl
  • 字段映射介绍:第二版模型对应的标量文件

适用场景

  • 天然产物分类模型训练: 利用Pickaxe增强SMILES数据集训练和优化天然产物分类模型
  • 模型预测结果解读: 通过类别、通路和超类别名称文件,准确解读模型输出的预测结果
  • 化学信息学研究: 分析SMILES数据与天然产物分类的关联规律
  • 模型性能评估: 对比不同版本Keras模型在天然产物分类任务中的性能表现
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 655.09 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。