LLM4Commit_Based_大语言模型提交信息生成研究复现包数据

数据集概述

本数据集为论文“Using Large Language Models for Commit Message Generation: A Preliminary Study”的复现包,包含实验评估数据与脚本文件,支持对大语言模型(LLM)生成代码提交信息的研究复现与分析,总文件数为1个。

文件详解

  • 文件名称:LLM4Commit.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含三类目录结构:
  • experiment_data/human_evaluation:存储2名参与者的人工评估结果
  • experiment_data/msg:存储各方法(基线模型、LLM模型)生成的提交信息及人工编写的提交信息
  • script:存储评估指标计算脚本、OpenAI API并行推理脚本

数据来源

论文“Using Large Language Models for Commit Message Generation: A Preliminary Study”

适用场景

  • 代码提交信息生成研究:复现LLM生成提交信息的实验,对比基线模型与LLM的生成效果
  • 自然语言处理模型评估:利用人工评估结果与评估脚本,验证LLM在特定任务中的性能
  • 大语言模型应用研究:分析LLM在代码辅助任务中的应用潜力与优化方向
  • 实验复现支持:为相关领域研究者提供标准化的实验数据与工具,支持研究结果的验证与扩展
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.06 MiB
最后更新 2026年1月23日
创建于 2026年1月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。