数据集概述
本数据集为Stack Overflow平台解决方案片段研究的支撑数据,包含两类人工标注文件:一类是对含解决方案片段的问题的分类数据,另一类是对解决方案片段的标注数据。数据用于分析Stack Overflow中解决方案片段的呈现方式及复用适配方法,为提升知识共享效率和优化生成式AI工具提供参考。
文件详解
- Manual-classification-question-in-SO.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含Stack Overflow中含解决方案片段的问题的人工分类数据,涉及问题类型、解决方案片段相关特征等分类信息
- Manual-annotations-Solution-Snippets-in-SO.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含Stack Overflow解决方案片段的人工标注数据,涉及片段呈现方式、复用适配需求等标注内容
数据来源
论文“How solution snippets are presented in answers posted on Stack Overflow and how they could be potentially reused”
适用场景
- 软件工程知识共享优化: 分析解决方案片段呈现模式,为提升Stack Overflow知识检索效率提供依据
- 生成式AI代码工具改进: 基于片段复用适配分类,优化AI生成代码的相关性与可理解性
- 开发者行为研究: 探究Stack Overflow用户回答问题时的解决方案片段构建习惯
- 软件教育资源开发: 基于片段呈现规律,设计更易理解的编程教学案例