数据集概述
本数据集是NORMAN可疑物清单交换平台(SLE)中S19 MZCLOUD清单的关联集合,包含mzCloud质谱数据库中的化合物信息。数据由Robert Mistrik提供,Nikiforos Alygizakis更新,2022年7月17日修复了PubChem提交的SMILES格式问题。数据集共3个文件,涵盖化合物的结构、质谱及标识信息。
文件详解
- 文件名称:mzCloud_Compounds_01042019_ed.csv
- 文件格式:CSV
- 字段映射介绍:包含mzCloudId(化合物ID)、CAS(CAS号)、CAS_RN(CAS登记号)、ChemicalName(化学名称)、SMILES(简化分子线性输入规范)、InChI(国际化合物标识)、InChIKey(InChI键)、MolForm(分子式)、Monoiso_mass(单同位素质量)、DTXSID_Linked(关联DTXSID)、DTXSID_Mapped(映射DTXSID)、Hyperlink_Compound(化合物链接)、Hyperlink_Spectra(谱图链接)等字段。
- 文件名称:mzCloud_InChIKeys_01042019.txt
- 文件格式:TXT
- 字段映射介绍:包含一系列InChIKey值(如HXACOUQIXZGNBF-UHFFFAOYSA-N等),每行一个化合物的唯一标识。
- 文件名称:mzCloud_Compounds_01042019_ed.xlsx
- 文件格式:XLSX
- 字段映射介绍:内容与CSV文件一致,为化合物信息的表格形式存储。
数据来源
NORMAN Suspect List Exchange(SLE)平台
适用场景
- 质谱数据分析:用于化合物的质谱匹配与鉴定,辅助未知化合物的结构解析。
- 环境污染物筛查:结合NORMAN可疑物清单,识别环境样品中的目标化合物。
- 化合物数据库整合:补充实验室或研究项目的化合物信息库,支持跨平台数据关联。
- 化学信息学研究:基于SMILES、InChI等结构信息,开展化合物性质预测与构效关系分析。