GitHub功能请求研究补充材料数据集

数据集概述

本数据集为GitHub功能请求研究的补充材料,包含分析所用仓库、问题数据、功能请求标签、标签组合频率、仓库趋势及聚类结果等文件,辅助理解GitHub平台上功能请求的特征与模式。

文件详解

  • repos.csv:CSV格式文件,包含研究分析所用的仓库列表。
  • issues.csv:CSV格式文件,包含仓库中所有问题数据,字段包括问题HTTP链接、创建/更新/关闭时间戳及状态原因。
  • FR_label_names.csv:CSV格式文件,列出被识别为功能请求的标签名称。
  • combosFR.csv:CSV格式文件,记录功能请求问题的标签组合频率。
  • combosNotFR.csv:CSV格式文件,记录与功能请求问题共存的非功能请求标签组合。
  • repos_trends.csv:CSV格式文件,跟踪仓库创建后前三年功能请求问题指标的变化趋势。
  • cluster_repos.csv:CSV格式文件,基于repos_trends.csv指标的仓库聚类结果。
  • pdps文件夹:包含所有特征的部分依赖图(PDPs)文件。

适用场景

  • 软件工程研究:分析GitHub平台功能请求的生命周期与特征分布。
  • 开源社区管理:探究仓库标签系统对功能请求分类的有效性。
  • 数据挖掘应用:研究标签组合模式与功能请求处理效率的关联。
  • 仓库发展分析:基于趋势数据识别仓库成长阶段与功能需求变化规律。
  • 机器学习辅助:利用部分依赖图理解特征对功能请求预测模型的影响。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 28.67 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。