BugC_Based_C语言开源项目缺陷定位数据集

数据集概述

本数据集为BugC数据集,包含从GitHub提取的21个C语言开源项目,用于缺陷定位研究。共涵盖36,617条已关闭问题,其中2,462条通过拉取请求(pull-requests)解决,可作为缺陷定位的有效样本。数据集以压缩包形式提供,包含各项目的问题与拉取请求信息文件。

文件详解

  • 文件名称:BuGC_Dataset.zip
  • 文件格式:ZIP(压缩包)
  • 字段映射介绍:压缩包内包含21个C项目的对应文件,每个项目提供JSON和XLSX两种格式文件,记录项目的问题(issues)和拉取请求(pull-requests)信息,可从中提取与缺陷修复相关的报告数据用于缺陷定位研究。

数据来源

GitHub开源项目

适用场景

  • 缺陷定位算法研究: 用于开发和验证C语言项目中缺陷位置自动识别的算法模型。
  • 开源软件开发分析: 分析C语言开源项目的缺陷分布特征、修复周期及拉取请求关联模式。
  • 软件质量评估: 基于缺陷报告数据评估开源C项目的代码质量和维护效率。
  • 软件工程教育: 作为教学案例,帮助学习者理解缺陷管理与修复流程。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 345.46 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。