智利等待列表临床语料库

数据集概述

该数据集是基于智利公立医院等待列表匿名转诊记录构建的临床语料库,包含九千份医疗和牙科转诊记录,经专业人员手动标注十种实体、六种属性及临床相关关系对,超百分之四十八的实体存在嵌套或包含关系,是首个智利西班牙语临床叙事标注语料库。

文件详解

  • 文件名称: LICENSE.txt:文件格式为TXT,内容为知识共享署名-非商业性使用-相同方式共享四点零国际许可协议文本。
  • 文件名称: cwlc.zip:文件格式为ZIP压缩包,包含各文档的原始文本文件及Standoff格式的标注文件。
  • 文件名称: cwlc_conll-format.zip:文件格式为ZIP压缩包,包含用于训练命名实体识别模型的CoNLL格式数据。

适用场景

  • 临床自然语言处理研究:用于训练和评估嵌套实体识别模型,特别是西班牙语临床文本的命名实体识别任务。
  • 医疗信息抽取应用:可提取转诊记录中的疾病、手术、症状等关键临床实体,支持医疗数据分析。
  • 多语言医学语料库建设:为西班牙语医疗领域的语料库资源补充提供参考。
  • 临床AI模型开发:辅助构建针对智利医疗场景的智能分诊、病例分析等应用模型。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 11.49 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。