-
GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据
2026年1月23日 30 87 11
数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
-
GitHub_Reactions使用情况探索性研究数据集2022
2025年12月20日 30 127 117
数据集概述 该数据集包含针对GitHub热门项目维护者的访谈回复数据,基于2022年VEM研讨会发表的《Como os mantenedores usam GitHub Reactions? Um estudo exploratório》研究。通过对17名维护者的调查,收集其对GitHub...
-
软件缺陷报告分析数据集SoftwareDefectReportAnalysis-fatenmekni
2025年5月7日 30 63 50
软件缺陷报告分析数据集SoftwareDefectReportAnalysis-fatenmekni 数据来源:互联网公开数据 标签:缺陷报告, 软件工程, 文本挖掘, 缺陷修复, 文本分类, 开发者协作, 开源项目, 机器学习 数据概述:...



