数据集概述
本数据集是NORMAN可疑物清单交换平台中S31清单关联的Wiley串联质谱数据集合,包含QqTOF仪器采集的高质量串联质谱数据,由Herbert Oberacher开发。数据以三种格式存储,涵盖化合物的结构标识、质谱信息及相关属性,可用于化合物识别和质谱分析,总计包含3个文件。
文件详解
- WRTMSD_InChIKeys.txt
- 文件格式:TXT
- 字段映射介绍:包含化合物的InChIKey标识符列表(如IQWYAQCHYZHJOS-UHFFFAOYSA-N),用于化合物的唯一标识与检索
- WRTMSD_wDTXSIDs_24012019.csv
- 文件格式:CSV
- 字段映射介绍:包含DTXSID、PREFERRED_NAME(首选名称)、CASRN(CAS登记号)、INCHIKEY(InChIKey)、IUPAC_NAME(IUPAC名称)、SMILES(简化分子线性输入规范)、INCHI_STRING(InChI字符串)、MOLECULAR_FORMULA(分子式)、AVERAGE_MASS(平均质量)、MONOISOTOPIC_MASS(单同位素质量)、DATA_SOURCES(数据来源)、NUMBER_OF_PUBMED_ARTICLES(PubMed文章数)、PUBCHEM_DATA_SOURCES(PubChem数据来源)、CPDAT_COUNT(CPDAT计数)等化合物属性字段
- WRTMSD_wDTXSIDs_24012019.xlsx
- 文件格式:XLSX
- 字段映射介绍:与同名CSV文件字段一致,包含化合物的结构、质量、来源等完整属性信息
数据来源
NORMAN Suspect List Exchange平台(https://www.norman-network.com/?q=suspect-list-exchange)
适用场景
- 化合物识别与鉴定:通过质谱数据和结构标识符(InChIKey、SMILES)匹配未知化合物
- 质谱数据库构建:整合高质量串联质谱数据,补充化合物质谱属性库
- 环境污染物筛查:结合NORMAN可疑物清单,用于环境样品中目标化合物的检测
- 药物与化学品分析:支持药物、化学品的结构验证和质谱特征研究