Natural_Language_Guided_Programming_Onward_2021_用户研究数据集

本数据集为论文《Natural Language-Guided Programming》（Onward! 2021收录）的用户研究数据，包含测试用例、模型预测及标注、训练与评估项目索引四类文件，用于评估自然语言引导的代码预测模型性能，支持相关研究的验证与复现。

文件名称：benchmark.json
文件格式：JSON
字段映射介绍：包含201个测试用例，每个测试用例含context（上下文代码）、natural language intent（自然语言意图）、target code（目标代码）及project_metadata（原始项目信息，含git url和license）。
文件名称：predictions-annotated.json
文件格式：JSON
字段映射介绍：包含论文中三个模型对benchmark.json中100个测试用例的预测结果，每个预测附三位标注者的定性评估。
文件名称：train-index.jsonl
文件格式：JSONL
字段映射介绍：模型训练所用的GitHub项目列表。
文件名称：eval-index.jsonl
文件格式：JSONL
字段映射介绍：模型评估所用的GitHub项目列表，benchmark.json的测试用例随机取自该列表的项目子集。

论文《Natural Language-Guided Programming》（Onward! 2021）

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	16.11 MiB
最后更新	2025年12月28日
创建于	2025年12月28日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。