Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test

数据集概述

本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。

文件详解

  • 文件名称:curated_test_set.json
  • 文件格式:JSON
  • 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:
  • 化学实体:标注原文中出现的化学名称,含“type”属性(区分“chemical”或“class”),部分实体关联Wikidata和PubChem标识符
  • 生物实体:标注原文中出现的生物名称,优先使用精确物种名,所有实体关联Wikidata标识符
  • 关系:仅标注原文中明确提及的生物与天然产物之间的关系,按原文出现顺序记录

适用场景

  • 生物信息学关系抽取模型评估: 用于测试端到端关系抽取模型在生物与天然产物关系识别任务中的性能
  • 生物实体与化学实体标注研究: 分析人工标注规则(如实体类型区分、标识符关联逻辑)对模型训练的影响
  • 生物医学文本挖掘: 为生物医学文献中生物-天然产物相互作用的自动抽取提供标注数据支持
  • 知识库构建: 辅助构建包含生物与天然产物关系的专业领域知识库
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.64 MiB
最后更新 2026年1月11日
创建于 2026年1月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。