基于LLM的编码助手澄清问题设计数据集及模型权重

本数据集包含用于研究“通过设计激发好奇心：基于LLM的编码助手询问澄清问题”的实验数据与模型权重，涵盖用户研究样本文档、分类器训练数据、测试管道数据、合成数据集及训练后的模型权重文件，为编码助手交互机制研究提供支持。

文档文件：
Sample of User Study RQ1_ name of user.pdf：PDF格式，用户研究RQ1样本文档
Sample of User Study RQ2_ name of user.pdf：PDF格式，用户研究RQ2样本文档
数据文件：
classifier_train_dataset.json：JSON格式，分类器训练数据集
test_pipeline.csv：CSV格式，测试管道数据，含Initial User Prompt（初始用户提示）、Clarification Question（澄清问题）、User follow-up response（用户后续响应）字段
clarification_module_synth_dataset.json：JSON格式，澄清模块合成数据集
归档文件：
checkpoint-8424.zip：ZIP格式，模型检查点文件
gemma3-1b-it-ft-new-data.zip：ZIP格式，Gemma3-1B模型微调权重文件

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	587.23 MiB
最后更新	2025年12月7日
创建于	2025年12月7日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。