自主测试代理基准数据集

数据集概述

该数据集是针对自主测试代理(Autonomous Tester Agents)的基准测试数据,包含由专业测试人员编写的三个Web应用的一百个测试用例,其中半数为原始用例的变异版本,用于评估代理的bug识别能力,测试用例含需精确断言的多步骤任务。

文件详解

  • 文件名称: ISSTA_ARTEFACT.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 该压缩包为ISSTA 2025会议论文的复现包,内部可能包含自主测试代理基准测试用例、SeeAct模型评估数据及结果复现源代码等内容

适用场景

  • 自主测试代理算法研发: 用于评估不同自主测试代理模型的bug识别能力与任务执行精度
  • 软件测试自动化研究: 分析测试用例变异对代理性能评估的影响
  • 学术研究复现: 复现ISSTA 2025会议相关论文的实验结果
  • Web应用测试技术优化: 探索针对多步骤断言任务的测试策略改进方向
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.46 MiB
最后更新 2025年12月26日
创建于 2025年12月25日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。