小型语言模型单元测试生成能源足迹研究数据集

数据集概述

本数据集围绕小型语言模型(SLM)与传统工具在单元测试生成中的能源消耗差异展开研究,对比分析Phi-3.1 Mini 128k模型与Pynguin工具的能源使用及故障发现效果,为软件工程自动化测试的可持续性评估提供实证数据。

文件详解

  • README.md:Markdown格式文档,介绍复制包的整体概述、包含文件及使用说明,帮助用户复现研究。
  • fault_finding_effectiveness_analysis.ipynb:Jupyter Notebook文件,采用描述性统计方法分析两种工具生成测试套件的故障发现效果。
  • collected_data.zip:压缩文件,包含研究中收集的原始实验数据,为分析提供基础数据源。
  • bayesian_data_analysis_energy_consumption.ipynb:Jupyter Notebook文件,使用贝叶斯数据分析方法对比Phi模型与Pynguin的能源消耗差异。

适用场景

  • 软件工程可持续性研究:分析自动化测试工具的能源消耗特征,评估SLM在常规任务中的环境影响。
  • 测试工具性能对比:对比SLM与传统工具在单元测试生成中的能源效率及故障发现能力。
  • 贝叶斯数据分析应用:作为实证案例,用于软件测试领域的贝叶斯统计方法实践与教学。
  • 自动化测试工具选型:为企业或研究机构选择低能耗单元测试生成工具提供数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.03 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。