数据集

GitHub问题生成的LLM软件需求数据集

数据集概述

该数据集包含基于GitHub五个开源仓库（pytorch/pytorch等）的功能请求，由o3-mini和deepseek-r1-distill-llama-70b两个LLM通过三种提示策略生成的软件需求，以及qwen-qwq-32b模型对需求质量的评估结果，可用于分析生成模型和提示技术对需求质量的影响。

文件详解

数据文件：
issues.csv：CSV格式，包含源功能请求，字段有仓库名称、问题编号、问题标题
all_requirements.csv：CSV格式，存储生成的软件需求，字段有仓库名称、问题编号、问题标题、生成模型、提示风格、需求文本
parsed.csv：CSV格式，包含需求质量评估结果，字段有仓库名称、问题编号、问题标题、生成模型、提示风格、需求文本、评估解释、明确性得分、可验证性得分、单一性得分
可视化资产：
boxplot_deepseek.png：PNG格式，展示deepseek模型生成需求的评分分布（按提示风格）
boxplot_o3-mini.png：PNG格式，展示o3-mini模型生成需求的评分分布（按提示风格）
requirements_evaluation_histogram.png：PNG格式，对比两个模型在三个评估指标上的得分分布
代码脚本：
prompts.py：Python文件，定义LangChain提示模板（零样本、专家角色、少样本）
extract_issues.py：Python文件，使用PyGithub库从GitHub仓库提取功能请求
generate_requirements.py：Python文件，调用LLM生成需求并保存结果
evaluate_requirements.py：Python文件，使用qwen-qwq-32b模型评估需求质量
analyze_evaluations.ipynb：Jupyter Notebook，包含数据分析和可视化代码

适用场景

自然语言处理研究：分析不同LLM和提示策略对软件需求生成质量的影响
软件工程研究：探索自动化需求生成在开源项目中的应用潜力
提示工程研究：比较零样本、少样本、专家角色提示在特定任务中的效果
需求工程研究：评估AI生成需求的明确性、可验证性和单一性等质量属性

数据与资源

15288889.zipZIP
3.45 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	3.45 MiB
最后更新	2025年12月9日
创建于	2025年12月9日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

GitHub问题生成的LLM软件需求数据集

数据集概述

文件详解

适用场景

数据与资源

附加信息

注册成功！