找到145个数据集

标签: 代码分析

过滤结果
  • Stack_Overflow协作者回答数量代码质量违规与辍学者综合预测分析复现包

    2025年12月22日 30 21 5

    数据集概述 本数据集为Stack Overflow案例研究的复现包,围绕协作者回答数量、代码质量违规及辍学者状态三个任务,对21种算法进行评估,包含数据预处理方法(如归一化、标准化等)及CodeBERT模型微调等研究相关材料。 文件详解 文件名称: Replication Package.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 逻辑表达式理解与否定研究补充材料数据集

    2025年12月21日 30 188 54

    数据集概述 该数据集为论文《Understanding Logical Expressions with Negations: Its Complicated》的补充材料,包含逻辑表达式理解实验的原始数据、分析代码、可视化图表及实验文档,支持对逻辑表达式(含否定)认知复杂性的研究。 文件详解 实验数据文件:...
    packageimg
  • APRwithLLM_Based_自动程序修复与大语言模型代码操作完整数据

    2025年12月21日 30 190 64

    数据集概述 该数据集包含一个PDF文件,主题围绕APR(自动程序修复)与LLM(大语言模型)相关的代码操作内容,以文档形式呈现,为研究两者结合的技术应用提供资料支持。 文件详解 文件名称: top_10_code_operations_red_gradient.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • SNUTS_js_JavaScript单元测试坏味道检测项目数据集

    2025年12月21日 30 135 80

    数据集概述 本数据集围绕SNUTS.js工具展开,包含用于检测JavaScript单元测试中"坏味道"(不良实践)的相关文件,支持对JavaScript单元测试质量分析的研究与实验。 文件详解 文件名称: selected_projects_dataset.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • Rajiv_Thorat_Based_Python_Taint_Analysis_污点分析基准测试完整数据

    2025年12月20日 30 66 20

    数据集概述 该数据集是一个用于Python污点分析的基准数据集,旨在研究Python可用的污点分析工具。原始来源于Rajiv Thorat创建的基准测试库,包含测试用例和元数据,现简化后可用于特定工具的评估。 文件详解 该数据集包含4个文件,具体说明如下: - 文件名称: LICENSE - 文件格式: 无扩展名(no_ext) - 内容说明:...
    packageimg
  • 物联网可穿戴设备代码质量测试数据准确性及应用案例探索性研究数据集

    2025年12月19日 30 147 85

    数据集概述 该数据集是物联网可穿戴设备探索性研究的配套数据,围绕代码质量、测试、数据准确性及实际应用案例展开,包含实验数据、代码分析结果、统计表格与图表等多类型文件,为相关研究提供全面的数据支持。 文件详解 文档类文件: CIoT2024_IoT_Wearables_Additional_files.pdf:PDF格式,可能包含研究的补充说明文件...
    packageimg
  • Java代码可读性模型的以人为中心评估数据集

    2025年12月18日 30 7 3

    数据集概述 本数据集是论文《Reassessing Java Code Readability Models with a Human-Centered Approach》的配套代码与数据,包含研究概述文件和压缩包文件,为复现研究或深入分析Java代码可读性模型提供支持。 文件详解 该数据集包含两个文件,具体说明如下: - 文档文件: - study...
    packageimg
  • 跨语言缺陷定位数据集

    2025年12月16日 30 58 5

    数据集概述 该数据集是一个名为BuGL的跨语言缺陷定位数据集,主要用于缺陷定位相关研究。数据集以压缩包形式存储,未划分训练/测试集、数据/标签集或原始/处理数据,为相关领域提供了统一的跨语言缺陷定位数据支持。 文件详解 文件名称: BuGL.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg
  • DroidLeaks_真实世界Android应用资源泄漏缺陷数据集

    2025年12月15日 30 170 65

    数据集概述 该数据集包含292个真实世界开源Android应用中的资源泄漏缺陷,涵盖流行且大规模的应用程序。每个缺陷提供代码仓库、资源类、缺陷代码版本、修复代码版本及相关报告或拉取请求(若有)的链接,为研究Android应用资源泄漏问题提供数据支持。 文件详解 文件名称:DroidLeaks.zip 文件格式:ZIP(压缩文件)...
    packageimg
  • PhiGnet_Based_代码与数据复现研究完整包

    2025年12月14日 30 178 16

    数据集概述 该数据集包含PhiGnet相关的代码与数据,以单一压缩文件形式存储,未进行训练/测试、数据/标签或原始/处理数据的划分,无其他文件结构或预览内容。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: PhiGnet.zip - 文件格式: ZIP (.zip) - 文件内容:...
    packageimg
  • 模糊测试程序特征基准测试工件集

    2025年12月14日 30 5 1

    数据集概述 本数据集包含支持论文《Program Feature-based Benchmarking for Fuzz Testing》的FeatureBench基准程序、代码及数据,用于模糊测试的程序特征基准测试研究,含实验数据与可视化内容。 文件详解 文件名称: The Artifacts for Program Feature-based...
    packageimg
  • 代码分析工具趋势数据集2004_2023

    2025年12月14日 30 87 31

    数据集概述 本数据集聚焦2004至2023年代码分析工具的趋势对比,包含工具流行度数据及可视化图表,为研究代码分析工具的发展动态提供数据支持。 文件详解 文件名称: Popularity_Code_Analysis_Tools.xlsx 文件格式: Excel (.xlsx) 内容说明:...
    packageimg
  • 花粉运动与分析代码数据集2025

    2025年12月14日 30 92 30

    数据集概述 该数据集包含为Marcelo等人2022年发表的关于传粉者梳理行为改变蜜蜂身体花粉分布及花粉转移的研究论文所创建的代码与分析资料,支持相关研究的复现与验证。 文件详解 文件名称:Pollen-movement.pdf 文件格式:PDF 内容:可能包含花粉运动相关的代码说明、分析流程或结果报告...
    packageimg
  • RevDecode通用二进制数据集

    2025年12月14日 30 22 8

    数据集概述 本数据集为通用二进制数据集,用于论文《RevDecode: Enhancing Binary Function Matching with Context-Aware Graph Representations and Relevance Decoding》(发表于USENIX Security 2025),支持二进制函数匹配相关研究。...
    packageimg
  • NativeMethodsRT_软件开发分析_NativeMethodsRT数据科学完整数据集

    2025年12月14日 30 42 12

    数据集概述 该数据集围绕NativeMethodsRT主题展开,包含软件包、类、方法名称及功能相关信息,涉及统计模型相关内容。数据集由4个文件组成,包含压缩包、CSV数据文件和PDF文档,无目录层级结构,未区分训练测试或原始处理数据。 文件详解 数据集包含以下文件: PackageDescription.pdf:PDF格式文档,可能为软件包说明文件...
    packageimg
  • 软件仓库脆弱函数检测复现数据集

    2025年12月13日 30 133 38

    数据集概述 该数据集是用于复现"Detecting Vulnerable Functions in Software Repositories"研究的压缩文件,包含软件仓库脆弱函数检测相关的实验数据,未提供具体内容预览,以归档文件形式存储。 文件详解 文件名称: detect_vul_from_repo.zip 文件格式: ZIP (.zip)...
    packageimg
  • CC2Vec预训练模型与实验数据集

    2025年12月13日 30 13 3

    数据集概述 本数据集包含论文《CC2Vec: Distributed Representations of Code Changes》实验所用的预训练模型及相关数据,支持代码变更分布式表示研究,为复现实验或扩展分析提供基础资源。 文件详解 文件名称:data_and_model.zip 文件格式:ZIP压缩包...
    packageimg
  • 基于大语言模型的代码异味识别实验复现包

    2025年12月6日 30 153 106

    数据集概述 本数据集是论文《AttentionSmelling:使用大语言模型识别代码异味》的复现包,聚焦GPT-4o对Java代码中三种关键代码异味(长方法、上帝类、特性羡慕)的检测能力,包含实验全流程的Jupyter笔记本、数据集参考及分析脚本,支持研究复现与扩展。 文件详解 该数据集包含4个文件,具体说明如下: -...
    packageimg
  • GitHub_X_COBOL_Based_COBOL开源仓库数据完整集合

    2025年12月6日 30 2 0

    数据集概述 该数据集包含从GitHub挖掘的84个COBOL开源仓库数据,含项目开发周期元数据及1255个COBOL文件,支持COBOL遗留系统现代化、代码特性研究及开发工具构建,为COBOL实证研究提供数据基础。 文件详解 文件名称: Information_Of_Repo.xlsx,文件格式: XLSX,可能包含84个COBOL仓库的元数据信息...
    packageimg
  • 软件项目代码与文档综合数据集

    2025年11月21日 30 146 62

    软件项目代码与文档综合数据集_Software_Project_Code_and_Documentation_Composite_Dataset 数据来源:互联网公开数据 标签:软件工程, 代码分析, 文档, Python, C++, 数据集, 开源, 机器学习 数据概述: 该数据集包含来自开源软件项目的代码文件、文档和其他相关资源。主要特征如下:...
    packageimg