软件代码质量评估与代码异味检测数据集SoftwareCodeQualityAssessmentandCodeSmellDetectionDataset-dattamuthevi

软件代码质量评估与代码异味检测数据集SoftwareCodeQualityAssessmentandCodeSmellDetectionDataset-dattamuthevi

数据来源:互联网公开数据

标签:代码质量, 代码异味, 软件工程, 静态分析, 代码度量, Java, 代码缺陷, 机器学习

数据概述: 该数据集包含来自多个开源Java项目的代码质量评估数据,记录了不同版本代码的代码异味信息、代码度量指标以及项目元数据。主要特征如下: 时间跨度:数据记录了不同开源项目在特定时间点上的代码质量状况,时间跨度取决于各个项目的版本发布情况,最早可追溯到2016年。 地理范围:数据主要来源于全球范围内的开源Java项目,包括但不限于Spring Framework、JUnit、Kafka等。 数据维度:数据集包含多个CSV文件,主要数据项包括:代码异味类型、代码度量指标(如复杂度、耦合度、代码行数等)、代码缺陷详情、项目版本信息、代码文件路径等。 数据格式:数据以CSV格式为主,便于数据分析和处理。部分数据包含HTML、PDF和文本文件,提供了额外的信息和文档。数据经过了初步的收集和整理,可以用于代码质量评估和代码异味检测。 来源信息:数据来源于对多个开源Java项目的静态代码分析,通过代码分析工具收集了相关数据,并进行了结构化处理。 该数据集适合用于软件工程、代码质量评估、代码异味检测、机器学习等领域的研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于软件工程、代码质量、代码异味检测等领域的学术研究,如代码异味对软件维护成本的影响、代码度量指标与缺陷关联性研究等。 行业应用:可以为软件开发行业提供数据支持,尤其是在代码质量评估、自动化代码审查、软件缺陷预测等方面。 决策支持:支持软件开发团队在代码质量管理、技术债务管理、软件重构等方面的决策。 教育和培训:作为软件工程、代码质量分析、静态代码分析等课程的辅助材料,帮助学生和研究人员深入理解代码质量评估方法。 此数据集特别适合用于探索代码异味与软件缺陷之间的关系,评估不同代码度量指标对代码质量的影响,从而帮助开发人员编写更健壮、更易于维护的代码。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 10, 2025, 01:39 (UTC)
创建于 五月 10, 2025, 01:27 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。