JOSSE_Annotated_软件开发工作量专家估算标注数据集

数据集概述

本数据集为JIRA开源软件工作量(JOSSE)数据集,包含从Apache、JBoss、Spring三个开源项目的JIRA问题跟踪系统收集的软件开发与维护任务,标注了实际工作量,其中百分之十九的任务额外标注了专家估算值,每个数据点含任务描述文本属性,还说明了数据收集方法及六项数据质量优化流程。

文件详解

  • 文件名称:JOSSE_Dataset.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含JOSSE数据集核心内容,涵盖开源项目软件开发与维护任务记录,每条记录含任务描述文本属性、实际工作量标注,部分记录含专家估算工作量标注,具体字段需解压后查看内部文件结构

适用场景

  • 软件开发工作量估算模型训练: 利用标注的实际工作量与专家估算值,训练和优化任务级工作量预测模型
  • 开源项目管理分析: 分析Apache、JBoss、Spring等开源项目的任务工作量分布与维护特征
  • 专家估算与实际工作量对比研究: 探究专家对软件开发任务工作量估算的准确性及偏差规律
  • 软件数据质量优化研究: 参考数据集中的六项质量优化流程,开展软件开发领域数据清洗与预处理方法研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 184.14 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。