重构演化波动性研究完整结果代码与数据集

数据集概述

该数据集是《重构演化波动性研究》论文的可复现资源,包含48个项目的重构数据集、研究问题(RQ1-RQ5)的结果文件、Python脚本及预测代码。数据格式多样,支持实验复现与后续研究扩展,为重构演化波动性领域的学术研究提供基础数据与工具支持。

文件详解

  • Refactoring dataset.zip:JSON格式的重构数据集,涵盖48个项目的807651个重构实例具体数据,支持其他研究基于此扩展。
  • oddsRatioResults.csv:研究问题1(RQ1)的完整结果文件,包含90种重构类型的比值比(odd ratios)和p值统计数据。
  • RQ2-datacollecting.py:研究问题2(RQ2)使用的Python脚本,用于收集代码变更、历史记录、开发者经验等维度的指标数据。
  • sampling_result.json:研究问题4(RQ4)使用的样本数据集,用于分析重构波动性的成因。
  • RQ4 - Reasons explaination(Pictures).zip:重构波动性不同成因的具体示例文件,包含代码提交中重构变更的截图。
  • RQ5 - JIT_prediction.zip:研究问题5(RQ5)中预测重构演化波动性概率的源代码文件。

适用场景

  • 软件工程研究:可用于复现重构演化波动性相关实验,或扩展重构类型、波动性成因等主题的研究。
  • 代码分析工具开发:基于JIT预测模型代码,开发实时检测重构演化风险的工具。
  • 实证软件工程:分析重构类型与波动性的关联,探索开发者经验对重构决策的影响机制。
  • 数据驱动的软件工程:利用大规模重构实例数据集,训练重构行为预测与优化模型。
  • 学术论文复现:为相关领域研究者提供完整的实验数据、代码与结果,支持研究验证与方法改进。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 82.1 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。