数据集概述
本数据集为NORMAN Suspect List Exchange中的S87清单(CHLORINETPS),包含137种新兴污染物(CECs)的氯化副产物及小分子消毒副产物信息,91%可通过LC-ESI-HRMS检测。数据集共6个文件,覆盖化学物质系统名称、分子式、质谱参数等核心属性,支持环境污染物识别与分析。
文件详解
- 标识符文件(TXT格式)
- CHLORINETPS_DTXSIDs.txt:存储DTXSID标识符列表,格式为纯文本,每行一个DTXSID编码
- CHLORINETPS_InChIKeys.txt:存储标准InChIKey标识符,格式为纯文本
- CHLORINETPS_PubChem.txt:存储PubChem相关标识符,格式为纯文本
- CHLORINETPS_Notes.txt:包含清单说明性文本内容,格式为纯文本
- 结构化数据文件
- CHLORINETPS.csv:逗号分隔值格式,字段包括Systematic_name(系统名称)、SMILES(简化分子线性输入规范)、Monoisotopic_mass(单同位素质量)、Formula(分子式)、StdInChI(标准国际化合物标识)、StdInChIKey、CAS、PubChem_CID、ChemSpider、DTXSID、ID、Family、Group、TET、Chromatography(色谱方法)、Ionization(电离方式)、Preferable_ionization(优选电离方式)、[M+H]+、[M-H]-、[M]+、Fragments(碎片离子)
- CHLORINETPS.xlsx:Excel格式,包含与CSV文件一致的结构化化学物质属性数据
数据来源
NORMAN Suspect List Exchange(S87清单),基于Postigo et al(DOI: 10.1016/j.teac.2021.e00148)的CHLORINE_TPs数据库
适用场景
- 环境水质检测:通过LC-ESI-HRMS识别水体中的CECs氯化副产物
- 消毒副产物研究:分析饮用水消毒过程中产生的小分子副产物组成
- 化学物质数据库构建:补充环境污染物的结构、质谱参数等属性信息
- 污染物溯源分析:利用DTXSID、PubChem_CID等标识符关联污染物来源与毒性数据
- 分析方法开发:基于色谱、电离参数优化CECs氯化副产物的检测方案