数据集概述
本数据集包含Dubbo和Kafka两个项目的协同演化补丁文件、正负样本补丁压缩包及对应的人工检查结果表格,共计6个文件。内容涵盖协同演化补丁信息、正负样本(2天内协同演化/20天内未协同演化)的补丁数据及人工检查结果,可用于软件协同演化分析研究。
文件详解
dubbo_coevo_patches.txt
- 文件格式:TXT
- 字段映射介绍:包含Dubbo项目的协同演化补丁信息,字段顺序为proj(项目)、type(类型)、prod_sha1(产品代码哈希)、test_sha1(测试代码哈希)、prod_path(产品代码路径)、test_path(测试代码路径)
kafka_coevo_patches.txt
- 文件格式:TXT
- 字段映射介绍:包含Kafka项目的协同演化补丁信息,字段顺序同dubbo_coevo_patches.txt
negative-findings.xlsx
- 文件格式:XLSX
- 字段映射介绍:负样本(20天内未协同演化)的人工检查结果数据,按Windows文件资源管理器默认的自然排序算法排序
negative.zip
- 文件格式:ZIP
- 内容说明:负样本补丁压缩包,包含20天内未协同演化的样本补丁
positive-findings.xlsx
- 文件格式:XLSX
- 字段映射介绍:正样本(2天内协同演化)的人工检查结果数据,按Windows文件资源管理器默认的自然排序算法排序
positive.zip
- 文件格式:ZIP
- 内容说明:正样本补丁压缩包,包含2天内协同演化的样本补丁
适用场景
- 软件协同演化模式研究:分析Dubbo和Kafka项目中协同演化补丁的特征与规律
- 协同演化检测模型验证:利用正负样本及人工检查结果,验证协同演化检测模型的准确性
- 软件维护实践优化:基于协同演化样本,研究软件维护中代码与测试协同更新的最佳实践
- 版本控制系统数据分析:通过补丁文件中的哈希值和路径信息,分析版本控制系统中的代码变更关联