NorMedQA_Based挪威医疗问答基准数据集

数据集概述

本数据集为挪威医疗问答基准数据集(NorMedQA),包含1313条纯文本医疗问答对和1401条含图片的医疗问答对(图片版本仍在开发中),主要使用挪威语(书面挪威语和新挪威语),用于评估大语言模型在挪威医疗场景下的知识检索与推理能力。数据源于公开医疗考试问题,经清洗预处理,以JSON格式存储。

文件详解

  • 文件名称:norwegian_medical_qa_v2_txt_only.json
  • 文件格式:JSON
  • 字段映射介绍:每条记录包含源文档名称、问题编号(若有)、问题文本、参考答案文本;若为选择题,还包含错误答案文本。

适用场景

  • 挪威医疗领域大语言模型评估: 用于测试大语言模型在挪威语医疗问答任务中的知识准确性与推理能力。
  • 多语言医疗问答模型训练: 作为挪威语医疗问答数据补充,支持多语言医疗问答模型的训练与优化。
  • 医疗知识检索系统验证: 评估模型在特定语言(挪威语)医疗知识检索场景下的性能。
  • 医疗考试问题数据集应用: 基于医疗考试问题数据,开展医疗教育相关的问答系统研究。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.0 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。