找到2个数据集

标签: 临床信息抽取

过滤结果
  • ELMTEX_Based_临床报告结构化信息抽取大语言模型微调数据集

    2026年1月23日 30 201 189

    数据集概述 本数据集为ELMTEX项目相关论文配套数据,用于大语言模型在结构化临床信息抽取任务中的微调。包含英文和德文两种语言的训练与测试文件,总计四个JSON格式文件,无目录层级结构,文件类型统一为JSON格式。 文件详解 英文训练文件 文件名称:train_en.json 文件格式:JSON 字段映射介绍:用于大语言模型微调的英文临床报告训练数据...
    packageimg
  • DisTEMIST西班牙语临床病例疾病提及检测与标准化数据集

    2025年12月4日 30 205 64

    数据集概述 本数据集为DisTEMIST语料库,包含一千份西班牙语临床病例,病例中的疾病提及经人工标注并映射至SNOMED-CT概念。数据集分为训练集、测试集、背景集,同时提供多语言资源和跨术语映射文件,支持疾病实体检测与标准化相关研究。 文件详解 数据集以压缩包形式提供,核心内容包含以下目录与文件: - 主文件: -...
    packageimg