数据集概述
本数据集为S0 SUSDAT合并NORMAN疑似物清单(SusDat),是NORMAN疑似物清单交换平台的关联数据集合。包含化学品的唯一标识、名称、CAS号、InChIKey、DTXSID等信息,以及RTI和毒性值,由雅典大学Reza Aalizadeh编译,2025年6月3日更新至最新版本,共7个文件。
文件详解
- 元数据文件
- 文件名称:SusDat_metadata_20250625.xlsx、SusDat_metadata_20250625.csv
- 文件格式:XLSX、CSV
- 字段映射介绍:包含列头(Header)、源列头(Source_header)、列头URL(URL_header)、列头描述(Description_header)及示例值,解释数据集各字段的定义与来源,如Norman_SusDat_ID为唯一NORMAN标识
- 数据文件
- 文件名称:susdat_2025-06-03-092022.xlsx、susdat_2025-06-03-092022.csv
- 文件格式:XLSX、CSV
- 字段映射介绍:包含Norman_SusDat_ID(唯一标识)、Name(名称)、CAS_RN(CAS号)、Synonyms_ChemSpider(ChemSpider同义词)、Reliability_of_Synonyms_ChemSpider(同义词可靠性)等化学品基础信息字段
- 标识文件
- 文件名称:SusDat_InChIKeys_20250603.txt、SusDat_DTXSIDs_20250603.txt
- 文件格式:TXT
- 字段映射介绍:分别包含化学品的InChIKey和DTXSID标识信息
- 整理说明文件
- 文件名称:SusDat_curation_notes.txt
- 文件格式:TXT
- 字段映射介绍:记录数据整理历史,如2020年6月18日新增97K条目、2019年11月20日InChIKey修正等内容
数据来源
NORMAN网络平台(https://www.norman-network.com/nds/SLE/、https://www.norman-network.com/nds/susdat/)
适用场景
- 环境污染物筛查:利用疑似物清单识别环境样品中的潜在污染物
- 化学品毒性评估:结合RTI和毒性值分析化学品的环境风险
- 化学品标识标准化:通过CAS号、InChIKey、DTXSID等统一化学品标识,支持跨数据库关联
- 环境化学研究:为环境介质中未知污染物的非靶向分析提供疑似物参考库
- 数据整合应用:作为NORMAN疑似物清单交换平台的补充数据,支持全球疑似污染物数据共享与整合