找到8个数据集

标签: 代码质量评估

过滤结果
  • 计算机科学教育中基于静态代码分析的个性化学习分析数据集

    2025年12月16日 30 52 49

    数据集概述 本数据集围绕计算机科学教育中静态代码分析支持个性化学习分析的研究展开,包含相关实验数据及补充材料,旨在探究个性化反馈对学生代码质量、学习过程及参与度的影响,为编程教育优化提供数据支撑。 文件详解 文件名称: Dataset.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 基于机器学习的技术债务优先级排序数据集

    2025年12月15日 30 20 7

    数据集概述 该数据集围绕技术债务优先级排序展开,通过GitHub上Java开源项目的2616份调查响应构建,包含"是否偿还""3分类""优先级"三种标签策略的数据,用于训练预测技术债务偿还决策的机器学习模型。 文件详解 文档文件(PDF格式): research_web_consent-...
    packageimg
  • 美国地区Stack_Overflow代码片段质量分析复现包

    2025年12月14日 30 204 75

    数据集概述 本数据集为复现包,围绕美国不同地区Stack Overflow代码片段的质量展开研究,分析SQL、JavaScript等五种语言片段在可靠性、可读性等维度的表现,探究地域多样性指标与代码质量违规的关联,并通过定性分析补充质量维度。 文件详解 文件名称:Replication Package.zip 文件格式:ZIP压缩包...
    packageimg
  • 探索基于大语言模型的架构异味检测数据集

    2025年12月12日 30 140 62

    数据集概述 该数据集围绕软件系统中的架构异味(Architectural Smells)检测展开,重点研究Hub-Like Dependency(HL)异味。通过对比Google Gemini 1.5 Pro大语言模型与专业工具Arcan的检测性能,探索大语言模型在架构异味检测、解释及重构建议方面的应用潜力,为解决传统检测方法的局限性提供数据支持。...
    packageimg
  • 意大利面条代码与Blob反模式对程序理解影响的大规模实证研究数据集

    2025年12月12日 30 29 5

    数据集概述 该数据集包含用于研究意大利面条代码与Blob反模式对程序理解影响的实证数据及相关脚本,支持论文实验的复现与分析,为软件维护与质量研究提供数据基础。 文件详解 文件名称:questions.zip 文件格式:ZIP压缩包 内容说明:可能包含程序理解实验相关的问题材料 文件名称:postmortem-questionnaire-...
    packageimg
  • 源代码注释中960万链接研究数据集

    2025年12月10日 30 65 46

    数据集概述 本数据集为ICSE'19论文的研究工件,包含九百六十五万四千七百零二条源代码注释中的链接数据,关联语言及注释位置信息(含GitHub账户、仓库、提交哈希等),支持论文定量结果复现与软件工程研究复用。 文件详解 LICENSE.md: Markdown格式,可能包含数据集使用许可条款 README.md:...
    packageimg
  • 手动大方差克隆验证结果数据集

    2025年12月9日 30 201 136

    数据集概述 本数据集包含手动进行的大方差克隆验证结果,核心内容围绕克隆验证实验展开,为相关技术研究提供验证数据支持。 文件详解 文件名称: lv_clone_manual_validation.zip 文件格式: ZIP (.zip) 内容说明: 包含手动大方差克隆验证的相关结果数据,具体内容需解压后查看 适用场景 代码克隆检测技术研究:...
    packageimg
  • 基于大语言模型的代码异味识别实验复现包

    2025年12月6日 30 158 25

    数据集概述 本数据集是论文《AttentionSmelling:使用大语言模型识别代码异味》的复现包,聚焦GPT-4o对Java代码中三种关键代码异味(长方法、上帝类、特性羡慕)的检测能力,包含实验全流程的Jupyter笔记本、数据集参考及分析脚本,支持研究复现与扩展。 文件详解 该数据集包含4个文件,具体说明如下: -...
    packageimg