数据集概述
本数据集为论文“Using Large Language Models for Commit Message Generation: A Preliminary Study”的复现包,包含实验评估数据与脚本文件,支持对大语言模型(LLM)生成代码提交信息的研究复现与分析,总文件数为1个。
文件详解
- 文件名称:LLM4Commit.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含三类目录结构:
- experiment_data/human_evaluation:存储2名参与者的人工评估结果
- experiment_data/msg:存储各方法(基线模型、LLM模型)生成的提交信息及人工编写的提交信息
- script:存储评估指标计算脚本、OpenAI API并行推理脚本
数据来源
论文“Using Large Language Models for Commit Message Generation: A Preliminary Study”
适用场景
- 代码提交信息生成研究:复现LLM生成提交信息的实验,对比基线模型与LLM的生成效果
- 自然语言处理模型评估:利用人工评估结果与评估脚本,验证LLM在特定任务中的性能
- 大语言模型应用研究:分析LLM在代码辅助任务中的应用潜力与优化方向
- 实验复现支持:为相关领域研究者提供标准化的实验数据与工具,支持研究结果的验证与扩展