堆栈飞行员_StackPilot_源代码堆栈溢出与GitHub_Copilot代码片段对比数据集

数据集概述

本数据集旨在支持对Stack Overflow复制粘贴代码与GitHub Copilot生成代码的系统性对比分析。包含针对2,636个相同查询/提示的30,746条代码片段,覆盖两种查询/提示式编程模型的输出结果,为研究代码生成工具性能与差异提供基础数据。

文件详解

  • 文件名称:stackpilot.json
  • 文件格式:JSON
  • 字段映射介绍:未提供具体字段信息,推测包含查询/提示内容、Stack Overflow代码片段、GitHub Copilot代码片段等核心对比数据。

数据来源

论文“StackPilot: Contrasting Code Snippets from Stack Overflow and GitHub Copilot”

适用场景

  • 代码生成工具性能评估: 对比分析GitHub Copilot与Stack Overflow代码在正确性、效率等维度的差异。
  • 编程模型研究: 探索查询/提示式编程模型下不同工具的输出特征与适用场景。
  • 软件开发效率分析: 研究复制粘贴与AI生成两种编程方式对开发效率的影响。
  • 代码质量评估: 基于数据集构建代码质量评估指标,优化代码生成工具的输出效果。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 17.5 MiB
最后更新 2026年1月9日
创建于 2026年1月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。