数据集概述
本数据集是EMSE期刊论文《微服务采用是否影响开发速度?一项队列研究》的官方复制包,包含实现数据收集、预处理、分析的全部Python代码,以及研究过程中生成的分析图表、文章图表文件,支持复现研究结论。
文件详解
- 安装说明文件:INSTALL,TXT格式,包含各工具及Python依赖的详细安装步骤
- 分析图表文件:analysis_figures目录下,含ANCOVA假设验证、正态性QQ图、速度箱线图等8个PDF格式分析结果图表
- 文章图表文件:Article_figures目录下,含混淆变量CDF图、DAG图、研究设计图等11个PDF格式论文配图
- 代码文件:codes目录下,含Python代码(如数据收集、微服务检测、速度计算等13个.py文件)和R代码(如混淆变量匹配、统计分析等6个.R文件)
- 数据文件:data目录下,含案例组/对照组数据、原始微服务数据集、速度计算结果等文件
- 依赖与配置文件:requirements.txt(Python依赖)、github-token.txt(GitHub令牌配置)
- 主执行文件:main.py,Python格式,协调研究各阶段代码执行
数据来源
EMSE期刊论文《Does Microservice Adoption Impact the Velocity? A Cohort Study》官方复制包
适用场景
- 软件工程研究复现:复现微服务采用对开发速度影响的队列研究结论
- 微服务架构评估:分析微服务架构对软件项目开发速度的实际影响
- 软件度量方法研究:参考速度计算、混淆变量匹配等度量方法与统计分析流程
- 开源项目数据挖掘:基于代码实现从GitHub仓库收集项目维护活动数据的流程
- 统计方法应用验证:验证ANCOVA、线性回归等统计方法在软件工程研究中的应用效果