西班牙临床病例语料库词性标注数据集

数据集概述

该数据集是西班牙临床病例语料库(SPACCC)的首个词性标注版本,由基于FreeLing3.1的SPACCC_POS-TAGGER工具完成标注,为临床文本的词性分析提供结构化数据支持。

文件详解

  • 文件名称: SPACCC_POS.zip
  • 文件格式: ZIP压缩包(.zip)
  • 内容说明: 压缩包内包含西班牙临床病例语料库的词性标注数据,具体字段及结构需解压后查看原始文件

数据来源

Secretaría de Estado para el Avance Digital

适用场景

  • 临床自然语言处理研究: 用于训练或评估医疗文本的词性标注模型
  • 医学文本结构化分析: 辅助提取临床病例中的关键语法成分
  • 医疗语料库资源建设: 补充多语言临床文本标注数据集
  • 计算语言学应用: 探索专业领域(如医学)词性标注的特殊性与挑战
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 29.41 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。