SWE_Bench_V2_0_软件工程基准测试解决方案数据

数据集概述

本数据集为SWE-Bench+ V2.0版本,是一个专注于软件工程领域的基准测试数据集。包含一个JSON格式文件,主要涉及软件工程解决方案的相关输出信息,可用于软件工程任务的评估与分析。

文件详解

  • 文件名称:swe_solution_leak_outputs.json
  • 文件格式:JSON
  • 字段映射介绍:因无内容预览,具体字段未明确,但推测包含软件工程解决方案相关的输出信息,如代码修复结果、任务执行状态或评估指标等结构化数据。

适用场景

  • 软件工程基准测试: 用于评估代码修复、程序合成等软件工程任务的模型性能。
  • 软件开发工具评估: 测试自动化工具在实际软件工程问题中的解决能力。
  • 软件工程研究: 为软件工程领域的算法优化和方法改进提供实验数据支撑。
  • 代码质量分析: 基于解决方案输出数据,分析代码修复的有效性和完整性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.89 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。