数据科学库性能缺陷研究数据集

数据集概述

该数据集包含针对七个热门数据科学核心库的二百零二项性能缺陷研究数据,涵盖缺陷的影响、根本原因、定位与修复挑战及修复策略,为数据科学生态系统相关研究与开发提供支持。

文件详解

  • 压缩文件:
  • FSE_Datasets_PBs_in_DS_libs_01.zip: 压缩包格式,包含三个核心文件夹
  • 文件夹 RQ1&2_Impacts_and_Root_Causes: 含各迭代文件,记录仓库名、问题编号、缺陷影响(显式/隐式)、症状及根本原因分类标签
  • 文件夹 RQ3_Root_Causes_Locating_Fixing_Effort_Challenge: 记录数据科学库性能缺陷的定位与修复挑战
  • 文件夹 RQ4_Fixing_Strategy: 含文件记录仓库名、问题编号及低代码行数修复策略标签

适用场景

  • 数据科学库开发优化: 指导开发者识别与修复性能缺陷,提升库的运行效率
  • 软件缺陷研究: 支持性能缺陷影响、根本原因及修复策略的学术分析
  • 自动化修复工具研发: 基于低代码行数修复策略开发自动化缺陷修复技术
  • 数据科学生态系统评估: 为数据科学生态系统的性能优化方向提供实证依据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.2 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。