数据集

软件缺陷预测数据集SoftwareDefectPredictionDataset-harshadahadavale

数据来源：互联网公开数据

标签：软件工程, 缺陷预测, 代码度量, 机器学习, 缺陷检测, 软件质量, 代码分析, 数据挖掘

数据概述：该数据集包含软件代码的度量指标，记录了与软件缺陷相关的特征。主要特征如下：时间跨度：数据未标明具体时间，可视为静态的代码度量数据集。地理范围：数据未限定具体地理范围，适用于通用软件缺陷预测研究。数据维度：数据集包含多个代码度量指标，如代码行数（loc）、圈复杂度（v(g)）、基本块复杂度（ev(g)和iv(g)）、词汇量（n）、程序长度（v）、程序级别（l）、程序难度（d）、标识符数（i）、估计工作量（e）、分支数（b）、测试时间（t）、代码行数（lOCode）、注释行数（lOComment）、空白行数（lOBlank）、代码和注释行数（locCodeAndComment）、唯一操作符数（uniq_Op）、唯一操作数数（uniq_Opnd）、总操作符数（total_Op）、总操作数数（total_Opnd）、分支数（branchCount）以及缺陷标签（defects）。数据格式：CSV格式，文件名为train.csv，便于数据分析和建模。该数据集适合用于软件缺陷预测、代码质量评估和软件可靠性分析。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于软件工程、机器学习等领域的研究，如基于代码度量的缺陷预测模型构建、软件质量评估方法研究等。行业应用：为软件开发团队提供数据支持，尤其是在软件缺陷的早期预测、代码质量控制和风险评估等方面。决策支持：支持软件项目的风险管理和资源分配，帮助团队优化开发流程，提高软件质量。教育和培训：作为软件工程、数据科学等课程的实训素材，帮助学生和研究人员理解软件缺陷预测方法。此数据集特别适合用于探索代码度量指标与软件缺陷之间的关系，帮助用户构建预测模型，优化软件开发流程，提升软件质量。

数据与资源

versions_20250320022940.zipZIP
3.21 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	3.21 MiB
最后更新	2025年5月1日
创建于	2025年5月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

软件缺陷预测数据集SoftwareDefectPredictionDataset-harshadahadavale

数据与资源

附加信息

注册成功！