-
GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据
2026年1月23日 30 197 66
数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
-
Generative_AI_Based_软件架构研究_应用趋势挑战与未来方向_复制数据集
2026年1月13日 30 37 32
数据集概述 本数据集是“生成式AI在软件架构中的应用、趋势、挑战与未来方向”研究的复制包,包含研究过程中使用的搜索查询、文献筛选日志、数据提取表、纳入研究编码表等内容,支持研究的可重复性验证与进一步分析。 文件详解 文件名称:README.md 文件格式:MD...
-
自动化软件工程LLM提示报告复现数据集
2025年12月16日 30 196 170
数据集概述 本数据集为自动化软件工程LLM提示报告的复现包,包含数据提取结果、调查数据、评估代码及相关文档,覆盖论文筛选提示、LLM模型信息提取、调查问题与数据等内容,支持研究复现与扩展分析。 文件详解 该数据集包含十五个文件,具体说明如下: - 代码文件(.ipynb格式): -...
-



