基于偏最小二乘判别分析的缺陷预测数据集

数据集概述

本数据集围绕偏最小二乘判别分析(PLS-DA)在缺陷预测中的应用构建,包含用于模型创建、优化与评估的统一Java缺陷数据,以及自主开发的快速PLS-DA实现脚本,支持通过数据拆分完成分类任务。

文件详解

  • 文件名称: InfSci_database_code.zip
  • 文件格式: ZIP压缩包
  • 文件内容: 包含统一的Java缺陷数据集及自主开发的快速PLS-DA Matlab脚本,数据集整合了5个公开缺陷数据集的47,618个Java类数据;脚本采用bidiag2stab方法实现,支持80%训练、10%验证、10%测试的数据拆分分类

数据来源

Public Unified Bug Dataset for Java

适用场景

  • 软件缺陷预测研究: 用于PLS-DA模型在Java代码缺陷预测任务中的性能验证与优化
  • 机器学习算法实现: 可用于对比自主开发PLS-DA脚本与PLS_Toolbox工具的效率差异
  • 模型参数调优分析: 适用于探索PLS-DA模型在速度与精度平衡下的参数选择策略
  • 数据拆分策略研究: 可用于分析80-10-10拆分比例对缺陷预测模型评估结果的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 34.4 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。