数据集概述
本数据集为论文《Self-Admitted Technical Debt Practices: A Comparison Between Industry and Open-Source》的配套数据,包含行业与开源场景下自我承认技术债务实践的调查、访谈及项目选择数据,覆盖多编程语言项目,为软件工程领域技术债务研究提供实证数据支持。
文件详解
该数据集包含多种格式文件,具体说明如下:
- 数据文件(CSV格式,共11个):
- Interviews_Overall_Transcripts.csv:访谈记录数据,每行代表一个问题,每列(以#id命名)为受访者回答,列底部含受访者人口统计信息(不含公司及个人姓名)
- Survey_Industry_Answers.csv:行业调查结果数据,包含技术债务注释频率等问题的回答数据
- OSSProjectSelection_Python.csv、OSSProjectSelection_Java.csv、OSSProjectSelection_Ruby.csv、OSSProjectSelection_Javascript.csv:开源项目选择数据,含项目名称及沟通渠道信息
- Annotations_Policy_Design_Choices.csv:注释政策设计选择数据
- CodingAnnotationPoliciesResults.csv:编码注释政策结果数据
- 其他CSV文件:未明确说明的补充数据文件
- 文档文件(PDF格式,共3个):
- SurveyTemplate_Industry.pdf:行业调查问卷模板
- SurveyTemplate_OSS.pdf:开源社区调查问卷模板
- CodingAnnotationPoliciesResults.pdf:编码注释政策结果文档
- 说明文件(TXT格式,共1个):
- README.txt:数据集说明文档
- 压缩文件(ZIP格式,共1个):
- stats.zip:统计数据压缩包
数据来源
Empirical Software Engineering Journal(Springer)
适用场景
- 软件工程研究:分析行业与开源场景下自我承认技术债务实践的差异
- 技术债务管理研究:探究不同场景下技术债务注释策略及政策设计选择
- 开源项目分析:研究多编程语言开源项目的技术债务相关实践
- 实证研究支持:为技术债务领域的定量与定性分析提供原始数据
- 调查方法应用:作为软件行业调查与开源社区调研的方法参考案例