西班牙语循证医学临床试验语料库3版

数据集概述

该数据集是西班牙语的循证医学临床试验语料库(3版),包含一千二百篇文本(二十九万二千一百七十三条词元),涵盖期刊摘要与临床试验公告,标注了医学实体、语义关系等信息,为医学文本分析提供支持。

文件详解

  • 文件名称:CT-EBM-SP-v3.zip
  • 文件格式:ZIP压缩包
  • 核心内容:包含西班牙语临床试验相关文本及标注数据,涉及医学实体(如解剖学、化学物质)、药物信息、时间表达式等实体类型,以及干预、时间、事件相关的语义关系标注,约百分之八十一点七二的实体关联UMLS概念唯一标识符。

适用场景

  • 医学自然语言处理研究:用于西班牙语医学文本的实体识别、关系抽取模型训练
  • 循证医学研究:分析临床试验文本中的药物信息、时间特征及干预关系
  • 医学术语标准化:基于UMLS映射研究多源医学文本的术语统一方法
  • 临床决策支持:挖掘临床试验公告中的关键信息,辅助医疗决策分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 11.64 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。