数据集概述
本数据集来自一项受控多案例研究,涉及六名专业开发者与四个真实工业系统,控制了程序员技能、维护任务及学习效应等调节因素。包含缺陷报告、软件系统属性(代码异味)及其演化(代码变动)、开发者任务日期日志三类核心内容,共16个文件。
文件详解
- 缺陷报告文件
- 文件名称:如Defects_Dev3_SysC.xlsx、Defects_Dev2_SysB.xlsx等(共12个.xlsx文件)
- 文件格式:XLSX
- 字段映射介绍:记录从六个问题跟踪系统提取的缺陷报告数据,关联特定开发者与工业系统
- 软件系统属性文件
- 文件名称:InitialSmells.xls、FinalSmells.xls
- 文件格式:XLS
- 字段映射介绍:包含软件系统的代码异味属性数据,分为初始状态与最终状态两类
- 代码变动文件
- 文件名称:Changes.xls
- 文件格式:XLS
- 字段映射介绍:记录软件系统的代码演化(代码变动)数据
- 开发者任务日期文件
- 文件名称:TaskDates.xls
- 文件格式:XLS
- 字段映射介绍:指定开发者处理各系统/任务的工作日期日志
数据来源
Yamashita的博士论文《Assessing the Capability of Code Smells to Support Software Maintainability Assessments: Empirical Inquiry and Methodological Approach》
适用场景
- 软件可维护性评估研究:分析代码异味对软件维护难度的影响,验证代码异味指标的有效性
- 工业软件演化分析:探究真实工业系统中代码变动规律与质量演化趋势
- 开发者行为与缺陷关联研究:结合开发者任务日期与缺陷数据,分析开发者因素对软件质量的影响
- 软件工程案例研究:为受控多案例研究方法在软件工程领域的应用提供实证数据支撑