代码异味数据集_Crowdsmelling方法三年研究

数据集概述

本数据集基于Crowdsmelling方法,收集三年间与代码异味相关的数据,包含长方法、上帝类、特性 envy 三类代码异味的分类数据,辅以验证文档和统计文件,为代码异味检测研究提供支持。

文件详解

  • 数据文件(CSV格式):
  • 按年份/年份范围划分的代码异味文件,如feature-envy-2018.csv、long-method-2019.csv、god-class-2020+2019+2018.csv等
  • 核心字段:项目名称、包名、类名、方法名、代码度量指标(如NOP_method、CC_method等)、代码异味分类结果
  • 文档文件:
  • Exercise-Code smells detection (ESII 2020).pdf:PDF格式,描述代码异味验证所用的实验练习
  • 统计文件:
  • code-classification-statistics.csv:CSV格式,包含团队对方法和类进行分类的百分比统计数据

适用场景

  • 软件工程研究:分析不同代码异味的特征与分布规律
  • 代码质量分析:探索代码度量指标与代码异味的关联
  • 机器学习应用:构建代码异味检测的机器学习模型训练数据
  • 实证研究复现:支持Crowdsmelling方法相关研究的结果验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.8 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。