MEDDOPLACE医疗文档地点相关内容抽取黄金标准标注语料库

数据集概述

该数据集是MEDDOPLACE任务的黄金标准标注语料库,聚焦西班牙语医疗文档中地点相关内容的抽取,包含地点检测、归一化、分类及临床科室、国籍、患者流动等关联信息的标注,适用于生物医学自然语言处理研究。

文件详解

  • 文件名称: meddoplace_train+test+gazz+crossmap+multilingual_231003.zip
  • 文件格式: ZIP压缩包
  • 包含内容:
  • 训练集与测试集(多格式)
  • SNOMED术语词典
  • SNOMED与MeSH的交叉映射文件
  • 加泰罗尼亚语、英语、法语等八种语言的多语言银标准数据

数据来源

巴塞罗那超级计算中心(Barcelona Supercomputing Center)

适用场景

  • 生物医学自然语言处理研究:用于医疗文本中地点实体抽取模型的训练与评估
  • 医疗信息抽取任务:支持西班牙语临床文档中地点、科室、患者流动等信息的结构化提取
  • 多语言医疗NLP扩展:基于多语言银标准数据开发跨语言地点抽取模型
  • 术语资源整合研究:分析SNOMED与MeSH在医疗地点术语上的映射关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 30.28 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。