找到17个数据集

标签: PubChem

过滤结果
  • Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test

    2026年1月11日 30 131 100

    数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...
    packageimg
  • NORMAN_SLE_Supporting_Information_高分辨质谱可疑物筛查协作数据

    2026年1月11日 30 64 3

    数据集概述 本数据集为NORMAN可疑物清单交换(NORMAN-SLE)项目的支持信息,旨在促进欧洲及全球在高分辨质谱可疑物筛查领域的协作。包含5个文件,涵盖清单元数据、使用统计等内容,支持质谱分析中可疑物筛查的协作与数据共享。 文件详解 文件名称:12302_2022_680_MOESM1_ESM.csv 文件格式:CSV...
    packageimg
  • NORMAN_Suspect_List_Exchange_S44_STATINS_公共资源收集数据2019

    2025年12月30日 30 131 62

    数据集概述 本数据集是NORMAN可疑物质清单交换平台上S44清单对应的他汀类药物(降脂药物)集合,从公共资源中编译而来,包含他汀类药物的化学标识、结构信息及相关数据,共3个文件,覆盖TXT、CSV、XLSX三种格式。 文件详解 STATINS_InChIKeys_14022019.txt 文件格式:TXT...
    packageimg
  • 天然产物碳_13核磁共振预测数据集

    2025年12月20日 30 124 114

    数据集概述 该数据集包含211,280种天然产物的结构、属性及分类信息,通过RDKit生成二维结构,结合PubChem标识符补充名称,利用nmrshiftdb2关联碳-13 NMR化学位移值,采用三级分类体系,并在版本3中新增ACD/Labs计算的化学位移数据。 文件详解 文件名称:pnmrnp3.zip 文件格式:ZIP压缩包...
    packageimg
  • 人参皂苷F1生产相关多功能糖苷酶分子模拟数据集

    2025年12月16日 30 99 95

    数据集概述 该数据集包含人参皂苷F1生产相关的分子对接及动力学模拟数据,针对野生型β-葡萄糖苷酶BgDU及其DUase突变体与底物NG-R1、G-Rg1的结合动态及构象变化,开展了四组独立模拟研究,为糖苷酶结构工程改造提供数据支持。 文件详解 数据集包含四个核心文件夹,具体说明如下: - Docking Structure文件夹: -...
    packageimg
  • PubChem筛选数据提取的化合物谱矩阵数据集

    2025年12月12日 30 183 59

    数据集概述 本数据集包含从PubChem筛选数据中提取的化合物谱矩阵,涵盖不同来源(确证/初级实验)的多个矩阵文件,记录化合物库针对靶点组的实验结果,为化学信息学和化学基因组学应用提供数据支持。 文件详解 数据文件(CSV格式):...
    packageimg
  • 基于FairDataBR工具的PubChem氯喹分析数据集

    2025年12月11日 30 119 15

    数据集概述 本数据集是通过FairDataBR工具对PubChem化学数据库中氯喹相关数据进行分析的结果。涵盖化合物、物质、蛋白质、生物测定和专利五个类别,包含氯喹及其耐药相关转运蛋白、生物活性测定等信息,为氯喹相关研究提供数据支持。 文件详解 文件名称: Analise_PubChem_FairDataBR_v2.pdf 文件格式: PDF...
    packageimg
  • 单药治疗药物反应预测跨研究基准数据集

    2025年12月9日 30 168 10

    数据集概述 该数据集为单药治疗药物反应预测的跨研究基准数据,整合了细胞系药物反应、多组学、药物特征及建模分区数据。数据源于五个药理基因组学研究,经统一流程处理,包含药物反应指标、细胞系多组学信息、药物分子特征及训练验证测试分区文件。 文件详解 文件名称: csa_data.zip:压缩包格式,包含四类核心数据...
    packageimg
  • ChEBI中肽定义的补充数据集

    2025年12月7日 30 4 2

    数据集概述 本数据集是论文《Defining Peptides in ChEBI》的补充数据,包含肽本体修订文件、一阶逻辑定义文件、PubChem和ChEBI分子分类结果、人工评估表格及专家调查问卷等8个文件,为肽类化合物的定义与分类研究提供支撑。 文件详解 Additional File 1: chemlog.omn,格式为OWL...
    packageimg
  • 农药LD50毒性预测多模态深度学习数据集

    2025年12月6日 30 26 24

    数据集概述 本数据集为研究“ChenseNet121:一种用于LD50毒性估算的新型深度学习架构”提供支持,专门用于训练和评估农药急性经口毒性(LD50)预测的多模态深度学习模型。数据集整合了每种化合物的多种数据表征,包括分子结构图像、3D体素化体积、理化描述符及CSV格式的整合数据集,遵循EFSA指南,支持基于图像、结构和生化特征的机器学习模型训练。...
    packageimg
  • 基因_分子通路与疾病相关类别对化学暴露的敏感性数据集

    2025年11月28日 30 40 32

    数据集概述 该数据集围绕基因、分子通路及疾病相关类别对化学暴露的敏感性展开,包含化学-基因互作、基因互作计数、通路富集分析及疾病-通路关联矩阵等核心数据,为研究化学暴露的分子机制提供基础支持。 文件详解 Annotated chemical-gene interactions.xlsx:Excel格式,包含591,084条化学-...
    packageimg
  • 具有人类病原体分子靶点药理干预潜力的肽数据库

    2025年11月27日 30 17 9

    数据集概述 本数据集包含针对细菌、病毒、寄生虫和真菌等病原体的抗菌肽数据库,通过PubChem和ChEMBL获取肽的SMILES结构,经OpenBabel转换为一维SMI、三维MOL2和PDB格式,共七百一十八条具有抑制活性的肽,支持病原体分子靶点相关研究。 文件详解 该数据集由多个目录和文件组成,具体说明如下: - 补充资料文件: -...
    packageimg
  • SARS_CoV_2主蛋白酶抑制剂Nelfinavir与Epirubicin的计算机模拟分析数据集

    2025年11月26日 30 65 55

    数据集概述 本数据集基于计算机模拟方法,分析Nelfinavir和Epirubicin两种药物与SARS-CoV-2主蛋白酶(Mpro)的分子对接结合情况,包括结合构象能量预测、结合位点残基及能量值等核心数据,为新冠治疗药物研发提供理论参考。 文件详解 文件名称: SoftwareCitation.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 化学物质语义损失数据集-用于本体分类研究-sfluegel

    2025年5月31日 30 198 5

    化学物质语义损失数据集-用于本体分类研究-sfluegel 数据来源:互联网公开数据 标签:化学,本体,分类,语义,机器学习,ChEBI,PubChem,SMILES,GHS,数据集,科研 数据概述:...
    packageimg
  • 致幻化合物描述符数据集

    2025年4月14日 30 94 57

    致幻化合物描述符数据集 数据来源:互联网公开数据 标签:致幻化合物,分子描述符,PubChem,药物研发,化学性质,结构-活性关系,结构-性质关系 数据概述:...
    packageimg
  • 癌症相关药物SMILES表示数据集

    2025年4月14日 30 80 43

    癌症相关药物SMILES表示数据集 数据来源:互联网公开数据 标签:癌症药物,SMILES表示,化学结构,药物研发,分子表示, PubChem API, 数据增强 数据概述:...
    packageimg