I_BiDaaS_TID_合成呼叫中心数据集

数据集概述

本数据集为模拟呼叫中心交互数据,基于真实电话交互与典型呼叫中心对话场景构建,由演员模拟客户与坐席角色,通过不同移动及固定电话设备录制。包含原始音频波形、自动语音识别转录文本及词段时间戳、置信度得分等信息。

文件详解

  • 01_Synthetic CallCentresTID_I-BiDaaS_WP2_D2.1_v0.1_metadata.pdf:PDF格式文档,为数据集元数据说明文件。
  • 01_Synthetic CallCentresTID_I-BiDaaS_WP2_D2.1_v0.1.tar.gz:压缩包格式文件,可能包含原始音频波形、语音转录文本等核心数据文件。

适用场景

  • 语音识别技术研究:用于自动语音识别模型的训练与性能评估
  • 呼叫中心交互分析:探索客户与坐席对话模式及典型场景特征
  • 音频处理技术开发:研究不同设备录音质量对语音数据的影响
  • 自然语言处理应用:基于转录文本开展对话意图识别、情感分析等研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 27.01 MiB
最后更新 2025年12月4日
创建于 2025年12月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。