找到5个数据集

标签: 代码检测

过滤结果
  • 变质回归科学软件维护测试案例研究补充数据

    2026年2月9日 0 125 35

    数据集概述 本数据集是论文“Metamorphic Testing Meets Regression Testing: A Case Study of Scientific Software...
    packageimg
  • MuGNN_Based_Java_API误用检测框架数据_Archive

    2026年1月22日 30 63 54

    数据集概述 本数据集包含MuGNN框架相关数据,MuGNN是基于图神经网络和聚类的Java API误用检测框架,通过自定义API流图(AFG)捕获代码执行、数据及控制流,结合自监督预训练与聚类分析API使用模式,识别潜在误用,数据集以压缩包形式提供。 文件详解 文件名称:MuGNN-ISSTA.zip 文件格式:ZIP...
    packageimg
  • 软件相似度数据集

    2025年12月4日 30 200 74

    数据集概述 该数据集包含软件相似度学习的后处理数据,涉及软件功能的嵌入表示、软件信息提取结果及软件对的相似度评分数据,支持软件相似度相关研究与分析。 文件详解 数据压缩包: data.zip:ZIP格式压缩包,可能包含软件功能嵌入与信息提取的原始或处理后数据,如嵌入的软件图表示、函数名称及对应调用函数和函数令牌的信息。 相似度评分文件:...
    packageimg
  • 代码安全检测恶意代码数据集CodeSecurityDetectionMaliciousCodeDataset-pritioli

    2025年5月29日 30 186 121

    代码安全检测恶意代码数据集CodeSecurityDetectionMaliciousCodeDataset-pritioli 数据来源:互联网公开数据 标签:代码安全, 恶意代码, 文本分类, 机器学习, 源代码分析, 代码检测, 垃圾邮件, 安全防护 数据概述: 该数据集包含从公开渠道收集的源代码片段,用于识别潜在的恶意代码。主要特征如下:...
    packageimg
  • GPT GCJ 数据集:检测 LLM 编写的 Java 代码

    2025年2月13日 300 38 12

    来自 GCJ 2020 的 76K+ Java 文件,其中 17K 由 GPT-4o 生成,用于 AI 检测 GPT Java GCJ 源代码数据集 该数据集由 2020 年 Google Code Jam 竞赛中 1,000 多位作者编写的共 76,089 个 Java 源代码文件和用于代码生成检测的 GPT-4o 重写代码组成。 随着 OpenAI...
    packageimg