数据集

共情对话模型基准数据集

共情对话模型基准数据集数据来源：互联网公开数据标签：对话系统,共情,聊天机器人,虚拟助手,对话模型,情感分析,机器学习

数据概述：本数据集是一个全面的对话模型集合，为对话系统和对话研究提供了深刻的洞察和挑战。数据集分为训练集、验证集和测试集，每个集都包含对话及其对应的说话者ID、对话上下文、提示/话题、每个语句的自我评估分数和标签。这些丰富的信息为探索对话话题的可能性提供了基础。

数据用途概述：该数据集适用于创建和评估生成自然对话的机器学习模型、情感评分、话题分类等多种场景。研究人员可利用此数据开发共情开放领域的对话模型，如聊天机器人和虚拟助手；通过自我评估分数观察对话中的情感气氛变化，如情绪转换和语气变化；还可用于研究卷积注意力模型、LSTM、seq2seq架构、门控循环单元(GRU)和Transformer网络等以进一步提高对话模型的性能和准确性。

举例：该数据集包含三个CSV文件：train.csv、validation.csv和test.csv。每个文件中的每一行包含8列：语句索引(utterance_index)、对话上下文(context)、对话主题(prompt)、说话者语句(utterance)、语句自我评估分数(selfeval)以及对话标签(tags)。对话标签可用于对不同对话进行分类，如“闲聊”或“职业建议”，并可以比较标准模型和机器学习模型的表现。

数据与资源

共情对话模型基准数据集.zipZIP
4.46 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	4.46 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

共情对话模型基准数据集

数据与资源

附加信息

注册成功！