什么是好的提交信息数据集

数据集概述

本数据集围绕“什么是好的提交信息”主题,包含文献综述、问卷调查、提交信息标签数据等多类型资料,为研究提交信息质量标准及特征提供基础数据支持。

文件详解

数据集包含多个文件,具体说明如下: - 文献与问卷相关文件: - literature survery.xlsx:Excel格式,记录46篇相关文献的综述数据(对应Section 3.2) - Questionnaire.pdf:PDF格式,面向资深贡献者的问卷,含3个问题及初始问卷示例 - Frequency.pdf:PDF格式,说明各类别/子类别出现的数量及占比 - posts list.xlsx:Excel格式,包含Section 3.2中研究的所有帖子数据 - 提交信息标签数据: - sampled messages.csv:CSV格式,含1649条标记提交信息的元数据,主要字段包括: - label:标记(0=含“Why和What”,1=不含“Why和What”,2=不含“What”,3=不含“Why”) - if_mulit_commit:非原子提交标记(1=非原子) - new_message1:预处理后的提交信息 - maintenance type and expression way.xlsx:Excel格式,含RQ2结果,记录Why和What的表达方式及与维护类型的关联

适用场景

  • 软件工程研究:分析提交信息质量特征及分类标准
  • 实证研究支持:验证提交信息中“Why和What”要素对信息质量的影响
  • 开发实践优化:为开发者提供提交信息撰写的参考依据
  • 自然语言处理应用:训练提交信息质量自动分类模型
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 678.57 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。