客户服务中心关系策略数据集-旅行与电信领域-2016-veeralakrishna
数据来源:互联网公开数据
标签:客户服务中心,关系策略,IVAs,智能虚拟助手,旅行,电信,对话数据,注释,用户意图,语言类型
数据概述:
本数据集包含了从2016年8月在TripAdvisor.com航空论坛及三个商业客户服务中心智能虚拟助手(IVAs)收集的对话记录,涵盖旅行和电信两个领域。数据集记录了注释者标记的对确定用户意图不必要的文本,并通过第二轮注释确定了标记文本中的语言类型,如问候、背景信息、理由、感激、抱怨或情感表达。该数据集为提高IVAs的质量和关系能力提供了宝贵资源。
数据用途概述:
该数据集适用于客户服务中心研究、IVAs开发、对话系统优化、自然语言处理训练等场景。研究人员可以利用此数据集了解用户在对话中的关系策略;开发者可以改善IVAs的交互能力;教育和培训者可以将其用于教学演示和案例分析。此数据集为提升IVAs的用户满意度和对话质量提供了重要参考。
数据文件内容及格式:
x_y_align.csv
记录注释者x与其他注释者在组y中的对齐情况。
字段:
Annotator A ID:注释者x的ID
Annotator B ID:与注释者x计算对齐得分的注释者ID
Group ID:包含比较用户所在的4人注释组ID
Dataset ID:请求数据集y的ID
Request ID:请求的唯一ID,用于文件间连接
Text:原始请求文本
Annotator A Text:注释者A标记的文本,标记部分用[ 和 ]括起
Annotator B Text:注释者B标记的文本,标记部分用[ 和 ]括起
Length:原始请求文本的字符长度
Error:注释者A和B二元判断不一致的字符位置数
Alignment Score:按公式align = (n - e) / n计算的对齐得分
Agreement:注释者A和B是否认为任何标记部分必要
all_data_by_threshold.csv
记录所有请求的合并标记,每个请求按4个不同的阈值重复。
字段:
Dataset ID:请求数据集的ID
Group ID:标记的4人注释组ID
Request ID:请求的唯一ID,用于文件间连接
MultiIntent:1表示至少一个注释者标记文本包含多个用户意图,否则为0
Threshold:合并标记的阈值
MergedSelections:如果至少i个注释者标记为不必要的字符,则包含在标记部分用[ 和 ]括起
Unselected:MergedSelections中不在[ 和 ]括起的文本
Selected:MergedSelections中在[ 和 ]括起的文本
Removed:原始请求文本中被合并标记移除的文本比例
tagged_selections_by_sentence.csv
记录第二轮注释标记的第一轮注释中选择部分的关系语言,仅包含在all_data_by_threshold.csv中标记为非MultiIntent的请求。
字段:
Dataset ID:请求数据集的ID
Group ID:标记的4人注释组ID
Request ID:请求的唯一ID,用于文件间连接
Threshold:合并标记的阈值
MergedSelections:如果至少i个注释者标记为不必要的字符,则包含在标记部分用[ 和 ]括起
Unselected:MergedSelections中不在[ 和 ]括起的文本
Selected:MergedSelections中在[ 和 ]括起的文本
Greeting:Selected中是否存在某种形式的问候语
Backstory:Selected中是否存在自我揭露语言
Justification:Selected中是否存在理由语言
Rant:Selected中是否存在抱怨
Gratitude:Selected中是否存在感激语
Other:Selected中是否包含任何关系语言
Express Emotion:Selected中是否包含非抱怨的情感语言
all_multi_intent.csv
记录至少一个注释者标记包含多个用户意图的请求,适用于开发多意图检测策略。
字段:
Dataset ID:请求数据集的ID
Group ID:标记的4人注释组ID
Request ID:请求的唯一ID,用于文件间连接
Text:原始请求文本
Annotator x:如果注释者x认为文本包含多个意图则为1,否则为0
使用条款:
本RSiCS数据集在开放数据库许可证下免费公开,附加条件:
数据经过处理以移除个人身份信息(PII)和IVAs的来源。任何试图重新识别个人或商业IVAs数据源的行为都是禁止的。下载或使用该数据集将被视为同意不尝试任何形式的重新识别。
任何使用本数据集创建的出版物必须引用论文“Towards Awareness of Human Relational Strategies in Virtual Agents”。请参考bibTex。