数据集概述
本数据集包含Eclipse Platform UI、SWT、JDT、AspectJ、Birt和Tomcat六个开源Java项目的缺陷报告、提交历史及API描述数据,用于评估缺陷报告相关文件推荐的排序学习方法。数据集提供结构化的缺陷信息与修复记录,支持软件工程领域的缺陷修复效率研究。
文件详解
- 文件列表
- 压缩包文件:
bugfiles.zip,格式为ZIP,包含六个开源Java项目的缺陷数据文件
- 说明文档:
README.txt,格式为TXT,包含数据引用要求、获取源码方法等说明
- 项目数据文件(位于压缩包内)
AspectJ.[xlsxml]:AspectJ项目的缺陷报告与提交历史数据,格式为xlsxml
Birt.[xlsxml]:Birt项目的缺陷报告与提交历史数据,格式为xlsxml
Eclipse_Platform_UI.[xlsxml]:Eclipse Platform UI项目的缺陷报告与提交历史数据,格式为xlsxml
JDT.[xlsxml]:JDT项目的缺陷报告与提交历史数据,格式为xlsxml
SWT.[xlsxml]:SWT项目的缺陷报告与提交历史数据,格式为xlsxml
Tomcat.[xlsxml]:Tomcat项目的缺陷报告与提交历史数据,格式为xlsxml
- 通用字段映射
bug_id:缺陷报告ID
summary:缺陷报告摘要
description:缺陷报告描述
report_time:缺陷报告提交时间
report_timestamp:缺陷报告提交时间戳
status:缺陷报告状态
commit:修复缺陷的提交SHA-1哈希ID
commit_timestamp:提交时间戳
files:修复提交中涉及的Java文件完整路径
result:排序结果中阳性实例的位置
数据来源
OpenScience tera-PROMISE repository
适用场景
- 缺陷修复文件推荐研究:基于缺陷报告内容,评估相关文件推荐的排序学习方法性能
- 软件工程缺陷分析:分析开源Java项目的缺陷特征、修复周期及文件修改规律
- 代码版本控制研究:探究缺陷修复过程中的代码版本切换与增量索引策略
- 软件维护效率优化:为开发者提供缺陷报告相关文件的推荐工具设计支持
- 开源项目缺陷管理:辅助开源项目团队分析缺陷分布与修复趋势,提升管理效率