NPM_Based_NPM包可复现性研究数据集

数据集概述

本数据集为开源数据集,包含通过工具链构建的NPM包相关数据,涵盖diffoscope输出、工具链构建版本及npmjs注册表中的预构建包,共5个文件,用于研究NPM包的可复现性。

文件详解

  • 压缩文件
  • 文件名称:source-code-dataset-collection.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含源代码数据集相关压缩内容
  • 文件名称:build-artifacts-fse-2020.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含2020年FSE相关的构建产物压缩内容
  • 表格文件
  • 文件名称:weeklyDownloads_NonReproduciblePackages.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含不可复现NPM包的周下载量相关数据
  • 文件名称:finalSats.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含最终相关统计数据
  • 文件名称:packages_vs_nonReproducibleVersions.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含NPM包与不可复现版本的对比相关数据

适用场景

  • 开源软件可复现性研究: 分析NPM包构建过程的可复现性问题及影响因素
  • NPM包生态系统分析: 研究NPM包的下载量、版本情况与可复现性的关联
  • 软件开发工具链优化: 基于构建产物数据优化NPM包构建工具链的稳定性
  • 软件供应链安全研究: 探究不可复现NPM包对软件供应链安全的潜在影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1003.34 MiB
最后更新 2026年2月1日
创建于 2026年2月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。