数据集概述
本数据集是研究“无人机软件平台安全问题自动化识别与定性表征”的复现数据包,包含分析项目的安全相关缺陷数据、原始数据、研究脚本及结果文件,支持复现研究中的安全问题识别与分析过程。
文件详解
该数据集由多个文件夹和文件组成,具体说明如下:
- 1_Safety-Dataset 文件夹:
- bugs 文件夹:包含分析项目的缺陷数据文件,如 PX4-merged.json.gz、dDronin-merged.json.gz、ardupilot-merged.json.gz
- Dataset-safety-bugs.csv:CSV格式文件,包含所有项目中被分类为安全相关和非安全相关的句子原始数据
- 2_Scripts-and-generated-data (RQ1) 文件夹:
- main-program.py:执行所有子脚本以生成RQ1所需数据的主程序
- utilities.R:包含文本和问题数据预处理/索引相关函数的R脚本
- 1_Script-to-create-test-dataset.r:用于分析问题数据的简单R脚本
- 2_MainScript.r:协调utilities.R和1_Script-to-create-test-dataset.r执行的主R程序
- files-setDirectory 文件夹:存储main-program.py生成数据的目录
- fasttext 文件夹:存储main-program.py作为fastText输入使用的数据
- cross-project-analysis 文件夹:存储跨项目分析使用的数据
- main-program-grid-search.py:执行所有网格搜索分析实验的主程序
- 3_Results 文件夹:
- RQ1 文件夹:包含用于讨论RQ1结果的结果、脚本和图表
- RQ2 文件夹:包含用于讨论RQ2结果的结果、脚本和表格
适用场景
- 无人机软件安全研究:分析无人机软件平台中安全问题的类型与分布特征
- 缺陷自动化识别研究:验证基于文本分类的安全缺陷自动化识别方法有效性
- 软件安全定性分析:探索无人机软件安全问题的定性表征维度与描述框架
- 实证研究复现:复现“无人机软件平台安全问题自动化识别与定性表征”研究的实验过程与结果