数据集概述
本数据集是论文《Crowd-based Requirements Elicitation via Pull Feedback: Method and Case Studies》的在线附录,包含Tournify、S-Sys、V-Sys三个案例的原始数据、翻译数据、可读性评分、模糊性分析、标签数据及Kappa系数等,辅以图表文件、流程图源文件和Python分析脚本,用于支持众包需求获取方法的验证与分析。
文件详解
- 案例数据集文件(.xlsx格式)
- 文件名称:Dataset-Tournify.xlsx、Dataset-SSys.xlsx、Dataset-VSys.xlsx
- 字段映射介绍(以Tournify为例):包含Raw data(原始数据)、Automatically translated data(自动翻译数据)、Readability scores(可读性评分)、Vague hits(模糊词汇识别)、Tagging-XX(标签数据)、Compare-XX(标签对比)、Result-XX(最终结果)、Result-total(总结果)、Kappa-scores(Kappa系数)等标签页;S-Sys和V-Sys案例包含Raw data、Automatically translated data、readability scores、Vagueness、Tagging、Kappa-scores等标签页
- 图表文件
- 文件名称:Graphs_readability.aspx
- 文件格式:ASPX
- 内容说明:用于生成论文中图六和图七的图表数据,包含Flesch和ARI可读性评分的合并数据
- 流程图源文件
- 文件名称:CREUS-pdd.drawio
- 文件格式:DRAWIO
- 内容说明:论文中呈现的过程交付物图(PDD)的源文件
- Python分析脚本
- 文件名称:S-Sys V-Sys.ipynb、Tournify.ipynb
- 文件格式:IPYNB
- 内容说明:用于计算可读性评分和识别模糊词汇的Jupyter笔记本脚本,Tournify脚本包含输出结果,S-Sys和V-Sys脚本因保密未包含输出
数据来源
论文“Crowd-based Requirements Elicitation via Pull Feedback: Method and Case Studies”
适用场景
- 众包需求获取方法验证: 分析三种案例中众包反馈数据的处理流程与结果,验证拉式反馈方法的有效性
- 需求文本质量分析: 利用可读性评分、模糊性分析数据,研究众包需求文本的质量特征与优化方向
- 需求标签一致性评估: 通过Kappa系数数据,评估不同研究者对需求标签的一致性水平
- 需求工程工具开发: 基于数据处理流程与脚本,开发支持众包需求分析的自动化工具
- 案例研究复现: 为其他研究者复现论文中的案例分析提供完整的数据支撑