-
CodeSmell_Based_C_长方法与大类代码异味人工标注数据集
2026年1月26日 30 70 13
数据集概述 本数据集包含采用C#编程语言编写的开源项目代码,针对长方法(Long Method)和大类(Large Class,文中亦称God Class)两种代码异味进行人工标注。每个标注实例由至少两名标注员独立完成,数据集包含标注结果及标注依据的启发式信息,共4个Excel文件,可用于代码异味检测模型训练与评估、代码质量分析等场景。 文件详解...
-
基于持续反馈的机器学习代码异味检测优化数据集
2025年12月20日 30 77 51
数据集概述 本数据集围绕机器学习代码异味检测优化展开,包含20个Java系统中四类代码异味(上帝类、长方法、特性羡慕、拒绝遗赠)的检测结果、多工具标注数据、类与方法级指标,以及持续反馈策略的实验分析文件,支持相关检测性能优化研究。 文件详解 指标数据文件:...
-
代码异味数据集_Crowdsmelling方法三年研究
2025年12月8日 30 67 23
数据集概述 本数据集基于Crowdsmelling方法,收集三年间与代码异味相关的数据,包含长方法、上帝类、特性 envy 三类代码异味的分类数据,辅以验证文档和统计文件,为代码异味检测研究提供支持。 文件详解 数据文件(CSV格式): 按年份/年份范围划分的代码异味文件,如feature-envy-2018.csv、long-...
-
基于大语言模型的代码异味识别实验复现包
2025年12月6日 30 1 0
数据集概述 本数据集是论文《AttentionSmelling:使用大语言模型识别代码异味》的复现包,聚焦GPT-4o对Java代码中三种关键代码异味(长方法、上帝类、特性羡慕)的检测能力,包含实验全流程的Jupyter笔记本、数据集参考及分析脚本,支持研究复现与扩展。 文件详解 该数据集包含4个文件,具体说明如下: -...



