GitHub_Based_软件部分修复程序识别与完整修复建议基准数据集

数据集概述

本数据集是用于自动化程序修复工具的真实世界基准任务集合,聚焦于识别部分修复(Partial Fixes)并生成完整修复方案。通过GitHub API获取候选闭源问题,结合重新打开的问题及CI状态筛选策略,构建了包含超2000个部分修复案例的基准集,为相关工具提供测试与优化支撑。

文件详解

  • 文件名称:partial-fix.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含通过GitHub API筛选出的部分修复案例数据,具体内容未提供预览,推测包含问题ID、提交记录、CI状态、修复历史等与部分修复识别相关的信息。

数据来源

GitHub API及公开闭源问题数据

适用场景

  • 自动化程序修复工具测试: 用于验证工具识别部分修复、生成完整修复方案的能力。
  • 软件调试效率研究: 分析部分修复案例特征,优化调试流程与工具性能。
  • 版本控制数据分析: 基于GitHub提交记录与CI状态,研究代码修复模式与质量关联。
  • 程序修复算法优化: 为算法提供真实场景训练数据,提升修复准确性与完整性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 82.17 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。