-
GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据
2026年1月23日 30 106 105
数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
-
开发者情感分析基准研究数据集
2025年12月20日 30 74 73
数据集概述 该数据集是一项关于软件提交信息情感与情绪分析的基准研究数据,包含实验代码、预处理脚本、模型实现文件、数据压缩包及标注指南文档,为分析开发者在代码提交过程中的情感倾向提供技术实现与数据支持。 文件详解 代码文件(.ipynb格式,共11个): sentiment_PLMs.ipynb:基于预训练语言模型(PLMs)的情感分析实验代码...



