找到1个数据集

标签: 回答准确性

过滤结果
  • LetsAskAIAboutTheirPrograms_AI程序理解与评估数据集

    2026年1月19日 30 146 91

    数据集概述 本数据集包含OpenAI GPT-3.5生成的60个Python小程序(对应6个入门编程任务,每个任务10个功能正确的变体)、399个针对这些程序的理解问题、GPT-3.5和GPT-4对问题的798个回答,以及研究人员对回答正确性的标注和错误类型编码,同时包含数据处理与分析脚本。 文件详解...
    packageimg