基础设施即代码缺陷预测数据集2022

基础设施即代码缺陷预测数据集2022 数据来源:互联网公开数据 标签:基础设施即代码,缺陷预测,程序依赖图,Ansible,机器学习,开源数据,软件质量 数据概述: 本数据集关注基础设施即代码(Infrastructure-as-Code,简称IaC)策略中的缺陷预测,特别是针对基于YAML的Ansible语言的项目。数据集包含了从86个满足特定条件的开源GitHub仓库中提取的度量指标,这些仓库在过去六个月内至少有一次推送到主分支、至少有2次发布、至少11%的文件为IaC脚本、至少2名核心贡献者、具有持续集成实践、评论比例至少为0.2%、月平均提交频率至少为2次、月平均问题频率至少为0.023次、包含许可证文件以及至少190行源代码。数据集中的度量指标分为四类:IaC相关指标、Delta指标、过程指标和程序依赖图(PDG)相关指标。这些指标旨在评估和预测IaC代码的缺陷情况。 数据用途概述: 该数据集适用于基础设施即代码项目的缺陷预测研究、软件质量评估以及机器学习模型的开发和验证。研究人员可以利用这些度量指标来构建和改进缺陷预测模型,以提高IaC代码的质量和可靠性,同时也能为开发团队提供有价值的反馈,帮助他们改进代码。此外,该数据集还对于学习基础设施即代码和缺陷预测技术的学者和开发者具有重要价值。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 5.95 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。