Chemical_Based_分子结构特征与沸点离群值数据集

数据集概述

本数据集包含带编号的分子对象,核心变量为沸点(Y变量),其余为分子的结构特征,通过离群值列(值为1表示离群)标注约5%的已知离群分子(基于极性与非极性结构差异)。数据来源于已发表的沸点测量数据集及公共数据,结构特征由RDKit工具生成。

文件详解

  • 文件名称:for_pub_chem_outlier_dataset.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含分子编号、沸点(Y变量)、分子结构特征字段、离群值列(1表示离群分子)

数据来源

已发表的化学沸点测量数据集[1]、公共数据[2](PubChem)及RDKit工具生成的结构特征[3]

适用场景

  • 化学数据分析:研究分子结构特征与沸点的相关性,识别结构差异对沸点的影响
  • 离群值检测模型验证:作为带标注的离群值数据集,用于测试化学数据领域的离群值检测算法性能
  • 分子性质预测:基于结构特征构建沸点预测模型,分析极性/非极性分子的性质差异
  • cheminformatics工具应用:验证RDKit生成的结构特征在化学性质研究中的有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.04 MiB
最后更新 2026年2月8日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。