GPT_J代码克隆检测数据集

数据集概述

本数据集是关于GPT-J模型在代码克隆检测任务中的研究数据,包含复现研究所需的数据、代码及反驳结果相关文件,以压缩包形式存储,为代码克隆检测领域的研究提供支持。

文件详解

  • 文件名称: replication.zip
  • 文件格式: ZIP压缩包
  • 内容结构: 压缩包内包含三个核心目录
  • data/目录: 用于复现研究的数据文件
  • code/目录: 用于复现研究的代码文件
  • rebuttal/目录: 包含反驳相关的结果文件
  • 说明: 每个目录内均有独立README文件,具体细节需查看对应文档

适用场景

  • 代码克隆检测研究: 可用于分析GPT-J模型在代码克隆检测任务中的性能表现
  • 模型复现验证: 支持研究者复现基于GPT-J的代码克隆检测实验结果
  • 代码相似性分析: 为代码相似性检测算法的开发与优化提供数据基础
  • 反驳结果验证: 可用于验证研究中反驳部分的实验结论与分析逻辑
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 60.41 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。