基于持续反馈的机器学习代码异味检测优化数据集

数据集概述

本数据集围绕机器学习代码异味检测优化展开,包含20个Java系统中四类代码异味(上帝类、长方法、特性羡慕、拒绝遗赠)的检测结果、多工具标注数据、类与方法级指标,以及持续反馈策略的实验分析文件,支持相关检测性能优化研究。

文件详解

  • 指标数据文件:
  • metrics.xlsx:Excel格式,包含Java系统的类级和方法级指标数据,用于训练机器学习算法
  • 代码异味检测结果文件(CSV格式):
  • GodClass.csv:上帝类代码异味的检测结果数据,含系统、实体及多工具标注信息
  • LongMethod.csv:长方法代码异味的检测结果数据,字段包括System、Entity、JDeodorant等工具标注及Total、Agreement
  • FeatureEnvy.csv:特性羡慕代码异味的检测结果数据
  • RefusedParentBequest.csv:拒绝遗赠代码异味的检测结果数据,字段包括System、Entity、JSpirit等工具标注及Total、Agreement
  • 实验分析文档(PDF格式):
  • use_of_instances_from_test_as_feedback.pdf:测试实例作为反馈的使用说明文档
  • top_nk.pdf:关于top-nk分析的实验文档
  • one_time_general_feedback_result.pdf:一次性通用反馈策略的实验结果文档
  • diff_f1_by_badsmell.pdf:不同代码异味F1值差异的分析文档

适用场景

  • 软件质量分析:研究代码异味检测工具的性能优化方向
  • 机器学习应用:探索持续反馈策略在代码异味检测模型中的效果
  • 软件工程研究:分析四类典型代码异味的检测难点与优化路径
  • 实验方法验证:验证持续反馈与一次性反馈对检测性能的影响差异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 48.1 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。