数据集概述
该数据集为论文《Are Architectural Smells independent from Code Smells? An empirical study》的原始数据,包含对Qualitas Corpus中111个项目的架构异味与代码异味分析结果,以CSV格式存储相关性统计数据,支持二者独立性的实证研究。
文件详解
该数据集包含8个CSV格式文件,具体说明如下:
- 相关性分析文件(共7个):
- by-project-correlation-cycle-classes.csv:项目与循环类相关的相关性统计,包含项目名称、问题名称、曼-惠特尼P值、夏皮罗-威尔克P值、肯德尔P值、肯德尔Tau系数、皮尔逊P值、皮尔逊相关系数等字段
- by-project-correlation-mas-ud.csv:项目与MAS-UD相关的相关性统计
- by-project-correlation-cycle-exists.csv:项目与循环存在性相关的相关性统计
- by-project-correlation-mas-cd.csv:项目与MAS-CD相关的相关性统计
- by-project-correlation-cycle-size.csv:项目与循环大小相关的相关性统计
- by-project-correlation-mas-exists.csv:项目与MAS存在性相关的相关性统计
- by-project-correlation-mas-hl.csv:项目与MAS-HL相关的相关性统计
- 汇总文件:
- by-project-summary.csv:项目分析汇总数据,包含指标名称、问题名称、受影响项目数、P值005、相关系数05、相关系数06、有相关性的项目列表等字段
适用场景
- 软件质量研究:分析架构异味与代码异味的相关性及独立性
- 实证软件工程:验证代码质量问题间的关联规律
- 软件维护优化:为代码重构优先级提供数据支持
- 代码异味检测工具评估:对比不同检测工具的结果一致性