数据集概述
本数据集基于Maven库的实证研究,包含库维护者为修复软件漏洞所进行的安全重构操作数据。涵盖初步研究与RQ2的采样数据,记录了重构操作的时间周期、安全类别、重构模式及维护任务类型等信息,可用于分析安全重构的实践特征与应用场景。
文件详解
- 文件名称:forRQ2.xlsx
- 文件格式:XLSX
- 字段映射介绍:
- original sheet:含7853条安全发布重构操作数据,字段包括Fix URL(漏洞修复提交链接)、Refactoring URL(重构提交链接)、timing(重构时间周期:before/same/after)、Secure Category(漏洞类别)、Refactoring Pattern(重构操作类型)、CommitComment(重构提交备注)
- for_RQ2 sheet:含512条RQ2采样数据,在original sheet字段基础上新增CountOf(任务类型:单任务/多任务)、Corrective(是否为纠正性任务)、Adaptive(是否为适应性任务)、Perfective(是否为完善性任务)、Ner Feature(是否为新功能任务)、count_of_rule(纠正性与新功能任务的匹配计数)
- 文件名称:data.json
- 文件格式:JSON
- 字段映射介绍:含7853条初步研究与RQ1的安全发布重构操作数据,以仓库名为键,每条记录包含github_link(仓库链接)、fix_commit_id(漏洞修复提交ID)、secure_category(漏洞类别)、secure_release-refactoring_count(重构操作数量)、fixed_files(修复文件列表)、version(版本号)、version_release(版本类型:major等)、same_secure_release_refactoring/before_secure_release_refactoring/after_secure_release_refactoring(不同时间周期的重构操作详情,含refactoring_commit_id、refactoring_operation、refactoring_commit_message)
数据来源
论文“How do Library Maintainers Refactor to Secure Software? A Study of Maven Releases”
适用场景
- 软件安全重构实践分析:研究Maven库维护者在漏洞修复过程中使用的重构模式及时间分布特征
- 漏洞修复与重构关联性研究:分析不同类型漏洞对应的重构操作类型及有效性
- 软件维护任务分类研究:探究纠正性、适应性等维护任务与安全重构的关系
- 开源软件安全治理:为开源库的安全维护策略制定提供实证数据支持
- 软件工程教育:作为软件安全重构案例教学的数据源,帮助理解安全编码实践