数据集概述
本数据集包含神经网络训练数据、训练后的模型、模拟轨迹及PLUMED输入文件,支撑论文《Exploring Chemistry and Catalysis by Biasing Skewed Distributions via Deep Learning》的研究。数据分为神经网络相关数据和模拟轨迹两大分支,覆盖论文主体及补充材料中的案例,为深度学习辅助化学催化研究提供基础数据。
文件详解
该数据集包含两个ZIP格式压缩包,具体说明如下:
- 文件名称: NN-models-and-training-data.zip
- 目录结构: 按论文中的案例(如SN2)划分,每个案例含Forward/Reverse子目录,子目录下有unbiased(无偏数据)、results(含各迭代轮次trained models、PLUMED文件、COLVAR文件)、lightning_logs(训练日志)等子文件夹
- 核心内容:
- Training Datasets: 训练用COLVAR文件
- Trained Models: 各偏置迭代生成的Skewencoder模型(.pt格式)
- PLUMED Files: 用于生成COLVAR文件的输入文件
- Lightning Logs: 训练过程日志文件
- 文件名称: Trajectories.zip
- 目录结构: 按论文中的案例(如chaba、DA、SN2)划分,每个案例含不同反应方向或类型的子目录(如Backwards、Forwards、shallow等)
- 核心内容: 论文中展示的模拟轨迹文件
适用场景
- 化学催化研究: 分析深度学习偏置方法对化学反应路径模拟的影响
- 神经网络模型复现: 基于训练数据和模型文件复现论文中的偏置神经网络训练过程
- 分子动力学模拟验证: 利用PLUMED输入文件和轨迹数据验证偏置模拟方法的有效性
- 计算化学方法优化: 探索倾斜分布偏置技术在其他化学反应体系中的应用