Rust包生态系统中弃用声明深度分析数据集

数据集概述

本数据集包含Rust包生态系统中弃用声明分析的相关数据与脚本,围绕三个研究问题展开:识别非活跃及弃用库、分析弃用对下游依赖的影响、提取弃用库缺陷记录,为研究Rust生态系统依赖管理提供支持。

文件详解

  • 数据文件:
  • 数据集压缩包:包含crateio_dumps(Rust包数据)、advisory-db(GAD、RAD、OSV缺陷数据)等原始数据
  • 脚本文件:
  • 0_preprocess.ipynb:数据预处理脚本,提取依赖关系并过滤库
  • 1_RQ1.ipynb:识别非活跃库及计算直接下游包
  • 2_RQ1.ipynb:从非活跃库中识别弃用库并分类
  • 3_RQ2.ipynb:分析弃用后下游包数量变化
  • 4_RQ3.ipynb:从advisory-db提取弃用库缺陷记录
  • 工具文件:
  • parse_version.py:解析语义化版本字符串
  • vercmp.py:比较语义化版本顺序
  • 结果文件夹:
  • ./RQ1:存储RQ1相关结果数据,含keywords.xlsx(过滤关键词)
  • ./RQ2:存储RQ2相关结果数据,含osv子文件夹(漏洞记录)
  • ./RQ3:含Survey Answer.xlsx(53份调查回复)及advisory-db-keyword-filter(缺陷记录)

适用场景

  • Rust生态系统研究:分析包依赖关系、非活跃库识别及弃用声明类型
  • 软件维护研究:评估弃用声明对下游依赖管理的影响
  • 漏洞分析:提取并分析弃用库相关的缺陷记录
  • 实证软件工程:基于调查数据研究开发者对弃用库的处理行为
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 531.7 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。