基于LLM的编码助手澄清问题设计数据集及模型权重

数据集概述

本数据集包含用于研究“通过设计激发好奇心:基于LLM的编码助手询问澄清问题”的实验数据与模型权重,涵盖用户研究样本文档、分类器训练数据、测试管道数据、合成数据集及训练后的模型权重文件,为编码助手交互机制研究提供支持。

文件详解

  • 文档文件:
  • Sample of User Study RQ1_ name of user.pdf:PDF格式,用户研究RQ1样本文档
  • Sample of User Study RQ2_ name of user.pdf:PDF格式,用户研究RQ2样本文档
  • 数据文件:
  • classifier_train_dataset.json:JSON格式,分类器训练数据集
  • test_pipeline.csv:CSV格式,测试管道数据,含Initial User Prompt(初始用户提示)、Clarification Question(澄清问题)、User follow-up response(用户后续响应)字段
  • clarification_module_synth_dataset.json:JSON格式,澄清模块合成数据集
  • 归档文件:
  • checkpoint-8424.zip:ZIP格式,模型检查点文件
  • gemma3-1b-it-ft-new-data.zip:ZIP格式,Gemma3-1B模型微调权重文件

适用场景

  • 自然语言处理研究:分析LLM编码助手的澄清问题生成机制
  • 用户交互研究:探究编码场景下用户与AI助手的澄清对话模式
  • 模型训练应用:基于数据集微调编码助手的澄清问题分类或生成模型
  • 人机协作分析:研究澄清交互对编码任务效率的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 587.23 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。