数据集概述
本数据集包含Pickaxe增强的SMILES数据集、使用该数据集训练的第一版和第二版Keras模型,以及类别、通路和超类别名称文件,用于确保模型预测结果的正确解读,共7个文件。
文件详解
- 模型文件
- 文件名称:second_edition.keras、model_checkpoint_0.keras
- 文件格式:.keras
- 字段映射介绍:使用Pickaxe增强SMILES数据集训练的Keras模型文件,包含模型结构与训练参数
- 名称映射文件
- 文件名称:pathway_names.json、class_names.json、superclass_names.json
- 文件格式:.json
- 字段映射介绍:pathway_names.json为长度7的数组(样本值Alkaloids);superclass_names.json为长度69的数组(样本值Alkylresorsinols);class_names.json为类别名称映射文件
- 增强SMILES数据集
- 文件名称:pickaxe.json.gz
- 文件格式:.json.gz
- 字段映射介绍:Pickaxe生成的增强SMILES数据集压缩文件
- 标量文件
- 文件名称:second_edition_scalers.pkl
- 文件格式:.pkl
- 字段映射介绍:第二版模型对应的标量文件
适用场景
- 天然产物分类模型训练: 利用Pickaxe增强SMILES数据集训练和优化天然产物分类模型
- 模型预测结果解读: 通过类别、通路和超类别名称文件,准确解读模型输出的预测结果
- 化学信息学研究: 分析SMILES数据与天然产物分类的关联规律
- 模型性能评估: 对比不同版本Keras模型在天然产物分类任务中的性能表现