西班牙临床过敏笔记语料库

数据集概述

该数据集是首个西班牙语临床过敏笔记语料库,包含西班牙阿尔科尔孔基金会大学医院过敏科及急诊科197名患者的828篇临床文本,涉及病历模板多样,含拼写错误、缩写等非正式临床书写特征,为西班牙语过敏领域NLP研究提供数据支持。

文件详解

  • 文件名称: HUFA corpus annotation guidelines.pdf
  • 文件格式: PDF
  • 内容说明: 语料库标注指南文档,可能包含文本标注规则、术语解释及数据处理规范等内容。
  • 文件名称: HUFA_Corpus.jsonl
  • 文件格式: JSONL
  • 内容说明: 语料库主数据文件,以JSON Lines格式存储828篇临床过敏笔记的结构化文本数据。
  • 文件名称: HUFA example notes.pdf
  • 文件格式: PDF
  • 内容说明: 示例笔记文档,提供临床过敏笔记的具体样例,展示文本结构、书写风格及内容特点。

适用场景

  • 自然语言处理研究: 用于西班牙语临床文本的分词、命名实体识别、文本分类等NLP任务模型训练与评估。
  • 医学文本分析: 探索临床过敏笔记的书写模式、术语使用规律及信息抽取方法。
  • 医疗教育: 作为教学案例,帮助医学生或非专业人员理解临床过敏笔记的结构与内容特点。
  • 医疗信息系统优化: 为西班牙语电子病历系统的文本处理功能开发提供真实数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.01 MiB
最后更新 2025年12月23日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。