EHSAN可解释医疗保健情感分析NLP数据集

数据集概述

本数据集为EHSAN(可解释医疗情感标注)数据集,包含医疗领域的情感标注数据及实验代码相关文件,共6个文件,均为XLSX格式,无目录结构。数据覆盖训练、测试、验证阶段的主题与情感标注内容,以及大语言模型标注的数据集。

文件详解

  • Final_train_topic_and_sentiment.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含训练数据的主题与情感标注信息
  • Final_test_topic.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含测试数据的主题标注信息
  • Final_test_sentiment.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含测试数据的情感标注信息
  • Final_valid_sentiment.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含验证数据的情感标注信息
  • Final_valid_topic.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含验证数据的主题标注信息
  • 9337_LLM_annotated_dataset.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含9337条由大语言模型(LLM)标注的医疗情感数据集

适用场景

  • 医疗情感分析模型训练: 用于训练和优化医疗领域的情感分类模型,提升模型对医疗文本情感倾向的识别能力
  • NLP模型性能测试: 利用测试集和验证集评估医疗情感标注模型的泛化能力与准确性
  • 大语言模型标注效果研究: 分析9337_LLM_annotated_dataset.xlsx中大语言模型标注结果的质量,探索LLM在医疗情感标注任务中的应用潜力
  • 医疗文本主题分类研究: 基于主题标注数据开展医疗文本的主题分类算法开发与验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.08 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。