数据集概述
本数据集为NORMAN网络嫌疑物清单交换平台(SLE)中的S130 NDSEXTRAS清单,包含NORMAN数据库系统(NDS)所需、特定嫌疑物清单未涵盖的额外条目。数据集共5个文件,涵盖说明文档、标识符列表及结构化数据文件,用于补充NDS系统的化学物质信息。
文件详解
- 说明文件
- 文件名称:S130_NDSEXTRAS_Notes.txt
- 文件格式:TXT
- 字段映射介绍:包含清单编号(S130)、代码(NDSEXTRAS)、简称及简短描述等元信息
- 标识符列表文件
- 文件名称:S130_NDSEXTRAS_InChIKeys.txt
- 文件格式:TXT
- 字段映射介绍:存储额外条目的InChIKey标识符列表
- 文件名称:S130_NDSEXTRAS_DTXSID.txt
- 文件格式:TXT
- 字段映射介绍:存储额外条目的DTXSID标识符列表
- 结构化数据文件
- 文件名称:S130_NDSEXTRAS.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含化学物质的多维度信息,字段涵盖索引、Norman_SusDat_ID、名称、CAS号、PubChem CID、DTXSID、优选名称、IUPAC名称、InChIKey、SMILES、InChI、分子式、单同位素质量等
- 文件名称:S130_NDSEXTRAS.csv
- 文件格式:CSV
- 字段映射介绍:与XLSX文件字段一致,以逗号分隔的文本格式存储化学物质的索引、标识编号、名称、化学登记号、分子结构信息及质量数据等
数据来源
NORMAN网络(https://www.norman-network.com/nds/SLE/)
适用场景
- 环境化学物质数据库补充:用于完善NORMAN数据库系统的化学物质条目,补充特定嫌疑物清单未涵盖的内容
- 化学物质标识符映射:通过InChIKeys、DTXSID等文件实现不同化学物质标识符的关联与交叉验证
- 环境污染物筛查:为环境监测中的未知化学物质识别提供候选清单参考
- 毒理学数据整合:支持将额外化学物质条目与现有毒理学数据(如DTXSID关联数据)进行整合分析