数据集概述
本数据集为从GitHub科研软件项目中挖掘的SSL指标数据,包含16个JSON格式文件,覆盖coursedescriptions、sympy、yolov3、yolov5、simbody、ipython、astropy、numpy等项目的GitHub Issues和Git Commits信息,无目录结构,无训练/测试、数据/标签或原始/处理数据拆分。
文件详解
- 文件特征
- 总数量:16个
- 存储结构:无目录(目录深度0,目录数量0)
- 文件格式:全部为JSON(占比100.0%)
- 命名模式:采用"项目名_数据类型_日期.json"格式,例如coursedescriptions_github_issues_10-18-2021.json、yolov3_git_commits_10-20-2021.json
- 数据类型:包含GitHub Issues(问题)和Git Commits(提交记录)两类指标数据
数据来源
GitHub科研软件项目
适用场景
- 软件开发指标分析:用于研究科研软件项目的提交频率、问题处理周期等SSL相关指标
- 开源项目协作模式研究:分析不同科研软件项目的GitHub Issues互动情况与开发协作效率
- 代码版本演化追踪:通过Git Commits数据追踪项目代码的更新历史与版本迭代规律
- 科研软件质量评估:结合提交记录与问题数据评估项目的开发活跃度和维护质量