"英文标题:Global Approved Biologics Target Protein Information Database
数据集概述
收录全球已上市生物药品对应的靶标蛋白序列、三维结构及关联遗传信息,涵盖单克隆抗体、重组蛋白、疫苗等主要生物药品类别。数据按靶标蛋白-药品对应关系组织,覆盖全球主要药品监管机构获批的上市产品,横跨生物药品发展核心周期。颗粒度精确至单靶标蛋白、单药品层级,支持靶标结构特征与药品活性的关联分析。数据字段遵循生物信息学领域标准格式,定义清晰,可直接用于结构生物学建模与药物设计流程。该数据集是研究生物药品作用机制、优化现有药品及开发新靶标药物的基础资源,为靶标蛋白功能解析、药物亲和力预测、遗传变异对药物响应的影响等研究提供支撑。
字段详情
数据集包含以下核心字段:
target_uniprot_id:靶标蛋白UniProt数据库标识符,唯一标识特定靶标蛋白
drug_approval_number:药品批准文号,指监管机构授予已上市生物药品的唯一认证编号
protein_primary_sequence:靶标蛋白一级序列,单位氨基酸残基,指构成靶标蛋白的氨基酸线性排列顺序
protein_3d_structure_pdb_id:靶标蛋白三维结构PDB数据库标识符,指向蛋白质数据库中该靶标的空间结构数据
genetic_variant_snp:靶标关联遗传变异SNP位点,指靶标基因编码区或调控区的单核苷酸多态性位点
适用场景
- 生物药品研发企业开展靶标蛋白结构优化与新候选药物分子设计
- 结构生物学家分析靶标蛋白结构特征与药物结合位点的相关性
- 临床药理学家研究遗传变异对已上市生物药品临床响应的影响
- 药品监管机构评估生物类似药与原研药的靶标结合一致性
- 学术机构构建靶标-药物相互作用预测的机器学习模型"