共情对话模型基准数据集

共情对话模型基准数据集 数据来源:互联网公开数据 标签:对话系统,共情,聊天机器人,虚拟助手,对话模型,情感分析,机器学习

数据概述: 本数据集是一个全面的对话模型集合,为对话系统和对话研究提供了深刻的洞察和挑战。数据集分为训练集、验证集和测试集,每个集都包含对话及其对应的说话者ID、对话上下文、提示/话题、每个语句的自我评估分数和标签。这些丰富的信息为探索对话话题的可能性提供了基础。

数据用途概述: 该数据集适用于创建和评估生成自然对话的机器学习模型、情感评分、话题分类等多种场景。研究人员可利用此数据开发共情开放领域的对话模型,如聊天机器人和虚拟助手;通过自我评估分数观察对话中的情感气氛变化,如情绪转换和语气变化;还可用于研究卷积注意力模型、LSTM、seq2seq架构、门控循环单元(GRU)和Transformer网络等以进一步提高对话模型的性能和准确性。

举例: 该数据集包含三个CSV文件:train.csv、validation.csv和test.csv。每个文件中的每一行包含8列:语句索引(utterance_index)、对话上下文(context)、对话主题(prompt)、说话者语句(utterance)、语句自我评估分数(selfeval)以及对话标签(tags)。对话标签可用于对不同对话进行分类,如“闲聊”或“职业建议”,并可以比较标准模型和机器学习模型的表现。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.46 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。