数据集概述
本数据集为NORMAN可疑物质清单交换平台的S55 ZINCPHARMA列表,包含从ZINC15获取的八千六百余种药物信息,由雅典大学Reza Aalizadeh整理提供。2020年11月6日更新删除了碳酸盐的错误CAS号,含3个文件,覆盖药物化学结构、属性与标识符等信息。
文件详解
- ZINC15PHARMA.csv
- 文件格式:CSV
- 字段映射介绍:包含ID(编号)、Chemical_Name(化学名称)、CAS_RN(CAS号)、Formula(分子式)、SMILES(简化分子线性输入规范)、sdInChI(标准InChI)、sdInChIKey(标准InChIKey)、MS-Ready_SMILES(质谱适用SMILES)、MS-Ready_sdInChIKey(质谱适用InChIKey)、zinc_id(ZINC编号)、PubChem CID(PubChem编号)、DTXSID(DSSTox编号)、Monoisotopic Mass(单同位素质量)、[M]+(分子离子峰)、[M+H]+(质子化分子峰)、[M+NH4]+(铵加合物峰)、[M+Na]+(钠加合物峰)、[M+K]+(钾加合物峰)、[M+CH3OH+H]+(甲醇加合物峰)、[M]2+(双电荷分子离子峰)、[M+H]2(双电荷质子化分子峰)等字段。
- ZINC15PHARMA.xlsx
- 文件格式:XLSX
- 字段映射介绍:内容与CSV文件一致,为药物信息的表格化存储。
- ZINC15PHARMA_MSready_InChIKeys.txt
- 文件格式:TXT
- 字段映射介绍:包含质谱适用的InChIKey标识符列表,每行一个标识符(如VXTGHWHFYNYFFV-UHFFFAOYSA-N)。
数据来源
NORMAN Suspect List Exchange(https://www.norman-network.com/nds/SLE/),由雅典大学Reza Aalizadeh整理提供
适用场景
- 药物化学研究:用于药物分子结构分析、属性计算与化学信息学研究。
- 质谱数据分析:通过MS适用标识符与结构信息,支持药物的质谱检测与鉴定。
- 环境污染物筛查:作为可疑物质清单,用于环境样本中药物残留的监测与识别。
- 药物数据库整合:补充药物化学属性数据,支持药物信息系统的构建与完善。
- 药物安全评估:通过CAS号、PubChem CID等标识符关联药物毒性与安全数据。