用户活动标签推理评估数据集

本数据集为评估语言模型从事件语义描述生成用户活动标签的能力而构建，包含30项活动（10项含2个事件、10项含3个事件、10项含4个事件），通过余弦相似度对比模型生成标签与人工标注标签的准确性，支持用户界面交互活动的标签推理研究。

screenshots_&_soms.zip
文件格式：ZIP
内容说明：包含所有事件关联的截图文件，以及对应的屏幕对象模型（Screen Object Models），后者记录了截图中UI组件的层级关系（从Screen/Application到Icon/Text，含Container、Sidebar等中间组件）
evaluation_data.csv
文件格式：CSV
字段映射：
ScreenID：活动唯一标识符（同一活动内事件共享相同ID）
Screenshot：事件对应的截图文件名
EventType：用户输入类型（Left Click/Keyboard）
Text：Keyboard类型事件的输入文本（Left Click类型为空）
EventDescription：用户操作的语义描述（含操作对象与UI元素）
GroundTruth：人工标注的活动标签

论文“Enriching Process-Related UI Logs via Screenshot-Based Activity Labeling Using Vision-Language Models”

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	63.66 MiB
最后更新	2026年2月12日
创建于	2026年2月12日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。