数据集概述
本数据集为2018年夏季收集的EMSL/PNNL基组交换(BSE)输出数据,通过脚本采集所有基组与格式组合,包含BSE网站所有可用输出格式的档案,共64个文件,无目录结构,文件类型为.tar.bz2和.zip,各占50%。
文件详解
- 核心档案文件
- 文件名称:包含molproint.tar.bz2、supermolecule.min_gen.tar.bz2、molcas.zip等
- 文件格式:.tar.bz2(Linux/Unix系统,Unix换行符)、.zip(Windows系统,Windows换行符)
- 字段映射介绍:.min_gen后缀档案为勾选“Optimize General Contractions”按钮的输出;若与未勾选结果相同,则保留无.min_gen后缀档案
数据来源
EMSL/PNNL Basis Set Exchange
适用场景
- 计算化学基组数据交换:为不同操作系统(Linux、Windows)提供适配的基组数据格式
- 计算化学软件数据支持:为Molpro、Molcas、Dalton等计算化学软件提供对应格式的基组数据
- 基组优化研究:通过.min_gen后缀档案分析优化通用收缩对基组输出的影响
- 计算化学数据存档:作为2018年BSE完整输出的存档数据,支持基组数据的历史追溯与验证