数据集概述
本数据集为论文“pKa Prediction in Non-Aqueous Solvents”的支撑材料,包含研究中使用的所有化合物的预测与实验pKa值,以及COSMO-RS计算所用构象的.xyz文件,支持非水溶剂中pKa预测模型的验证与分析。
文件详解
- 数据文件(CSV格式,共5个)
- 文件名称:test_set_predictions.csv、high_error_solvent_preds.csv、low_error_solvent_preds.csv、aqueous_pkas.csv、unreliable_solvent_preds.csv
- 字段映射:包含化合物IUPAC名称、SMILES结构、溶剂类型、实验pKa值(pKa_exp)、校正后pKa值(pKa_OK)、预测pKa值(pKa_pred)等核心字段,部分文件含ID、参考文献来源、分子类型等补充信息
- 构象文件(ZIP格式,共2个)
- 文件名称:parameterization_set_xyz.zip、test_set_xyz.zip
- 内容说明:存储COSMO-RS计算所用化合物构象的.xyz格式文件,对应参数化集与测试集的分子结构数据
数据来源
论文“pKa Prediction in Non-Aqueous Solvents”(Zheng, J. W.等,2024)
适用场景
- 计算化学模型验证:用于验证非水溶剂中pKa预测模型的准确性与鲁棒性
- 化学性质分析:研究不同溶剂对化合物pKa值的影响规律
- 构效关系研究:结合分子结构(SMILES)与pKa数据,分析结构与酸性/碱性的关联
- 数据补充与扩展:为相关化学数据库提供非水溶剂pKa实验与预测数据支持