数据集概述
本数据集为SemEval-2024 Task 3的竞赛数据,聚焦对话场景下的多模态情感原因分析,包含文本单模态(TECPE)和多模态(MECPE)两个子任务的训练与测试数据,用于提取对话中的情感-原因对,支持情感计算与自然语言处理相关研究。
文件详解
- 说明文档
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:提供数据集基本说明、文件描述及任务相关链接
- 子任务1训练数据
- 文件名称:Subtask_1_train.json
- 文件格式:JSON
- 字段映射介绍:存储文本单模态情感原因对提取任务的训练实例,以列表嵌套字典格式组织
- 子任务2训练数据
- 文件名称:Subtask_2_train.json
- 文件格式:JSON
- 字段映射介绍:存储多模态情感原因对提取任务的训练实例,以列表嵌套字典格式组织
- 子任务1测试数据
- 文件名称:Subtask_1_test.json
- 文件格式:JSON
- 字段映射介绍:存储文本单模态情感原因对提取任务的测试实例,以列表嵌套字典格式组织
- 子任务2测试数据
- 文件名称:Subtask_2_test.json
- 文件格式:JSON
- 字段映射介绍:存储多模态情感原因对提取任务的测试实例,以列表嵌套字典格式组织
数据来源
SemEval-2024 Task 3官方发布
适用场景
- 情感计算研究: 用于对话场景下情感与原因关联关系的建模与分析
- 自然语言处理模型训练: 支持文本及多模态情感原因对提取任务的模型开发与性能验证
- 对话系统优化: 为智能对话系统提供情感理解能力的技术支撑
- 竞赛任务评估: 作为SemEval-2024 Task 3的标准数据集,用于参赛系统的性能评测与对比