EmoWOZ_Based_任务导向对话系统情感识别标注数据集

数据集概述

本数据集是基于MultiWOZ构建的任务导向对话情感识别数据集,包含超过1.1万条对话及8.3万条用户 utterance 情感标注。除MultiWOZ的人机对话外,补充了人机交互对话,覆盖数据驱动对话系统全生命周期的情感类型,采用OCC情感模型适配的7类情感标签。

文件详解

  • README.md
  • 文件格式:MD
  • 字段映射介绍:包含数据集基本说明、数据来源、格式及标签定义等文档信息
  • data-split.json
  • 文件格式:JSON
  • 字段映射介绍:未明确具体字段,推测为数据集划分相关信息
  • emowoz-dialmage.json
  • 文件格式:JSON
  • 字段映射介绍:未明确具体字段,推测为DialMAGE来源对话的情感标注数据
  • emowoz-multiwoz.json
  • 文件格式:JSON
  • 字段映射介绍:未明确具体字段,推测为MultiWOZ来源对话的情感标注数据

数据来源

论文“EmoWOZ: A Large-Scale Corpus and Labelling Scheme for Emotion Recognition in Task-Oriented Dialogue Systems”

适用场景

  • 任务导向对话系统情感识别模型训练: 用于构建和优化对话系统中的用户情感识别算法
  • 对话情感标注方案研究: 基于OCC模型适配的7类情感标签体系,探索任务导向场景下的情感分类方法
  • 人机对话情感分析: 分析不同来源(Wizard-of-Oz、人机交互)对话中的情感表达差异
  • 对话系统用户体验优化: 通过情感数据挖掘,提升数据驱动对话系统的交互自然度和用户满意度
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 169.74 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。