数据集概述
本数据集为围绕有限状态自动机(FSA)描述的用户-智能体交互语料库,包含结构化交互数据、FSA图形与状态表文件及RASA配置文件,用于支持对话系统研究,尤其关注视障用户的交互需求。
文件详解
- 核心交互数据文件:
- 未命名CSV文件: UTF-8编码CSV,含CODE_ID(交互ID)、Turn(轮次号)、Participant(发送方标识,U为用户/S为智能体)、Text( utterance内容)、VIP(用户是否为视障人士)、Token count( utterance词元数)、DAs_GOLD(对话行为标签)、Errors_GOLD(错误标签)、FSA_ID(关联的有限状态自动机ID)字段。
- 有限状态自动机相关文件:
- FSA01.png、FSA02.png: 自动机图形表示的PNG文件(共2个)
- FSA01.html、FSA02.html: 包含自动机状态表的HTML文件(共2个)
- 模型配置文件:
- rasa_config.zip: 用于训练DIET分类器的RASA配置文件压缩包
适用场景
- 对话系统研究: 用于训练和评估面向视障用户的教育对话系统
- 自然语言处理: 对话行为识别、错误检测等任务的模型训练与验证
- 教育技术研究: 分析视障用户与智能体关于有限状态自动机的交互模式
- 人机交互设计: 优化针对特殊用户群体的智能体交互流程与反馈机制