业务流程描述中歧义检测的标注数据集

数据集概述

本数据集包含七十一条业务流程描述的歧义标注数据,采用Franceschetti等人提出的业务流程管理(BPM)歧义分类体系进行标注,涵盖声明式和命令式两种流程描述类型,为研究业务流程文本中的歧义识别提供标注资源。

文件详解

  • 综合标注数据文件:
  • Ambiguity Annotations - All Descriptions.csv:CSV格式,包含七十一条流程描述的歧义标注数据,字段包括filename(文件名)、sentence(句子)、reason(歧义原因)、T1-T4(歧义类型标记)、ambiguity_num(歧义数量)
  • 声明式描述标注数据文件:
  • Ambiguity Annotations - Declarative Descriptions.csv:CSV格式,包含五十条以业务规则为主的声明式流程描述歧义标注数据,字段同综合文件
  • 命令式描述标注数据文件:
  • Ambiguity Annotations - Imperative Descriptions.csv:CSV格式,包含二十一条以流程流为主的命令式流程描述歧义标注数据,字段同综合文件
  • 标注指南文件:
  • Annotation guidelines - Ambiguity Detection.pdf:PDF格式,包含构建数据集所遵循的歧义标注规范

适用场景

  • 自然语言处理研究:用于训练和评估业务流程文本中的歧义检测模型
  • 业务流程管理研究:分析不同类型(声明式/命令式)流程描述的歧义特征与分布
  • 企业流程优化:识别实际业务流程文档中的歧义问题,提升流程清晰度
  • 标注方法论研究:参考基于BPM歧义分类体系的标注规范设计
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.93 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。