-
SATD_Based_开源项目问题跟踪系统技术债务实例数据
2026年1月30日 30 210 130
数据集概述 本数据集包含从微软Visual Studio、GitLab Community Edition等5个开源项目中收集的286个基于问题跟踪系统的自承认技术债务(SATD-I)实例。数据用于研究SATD-I的来源、处理周期、引入原因及类型分布,为技术债务管理工具设计提供实证支持。 文件详解 文件名称:Beyond the Code_Mining...
-
可配置系统编译错误识别大语言模型能力评估数据集2024
2025年12月18日 30 76 24
数据集概述 该数据集包含对大语言模型(LLMs)识别可配置系统编译错误能力评估的查询日志文件,数据来源于Albuquerque et al. 2024(SBES-IIER 2024)的相关研究,为分析LLMs在该任务中的表现提供支持。 文件详解 文件名称: sheet.css,文件格式: CSS,用于网页样式定义 文件名称: Small -...
-
C语言反编译器保真度问题分类数据集
2025年12月13日 30 166 28
数据集概述 本数据集为USENIX Security论文《A Taxonomy of C Decompiler Fidelity Issues》的补充材料,包含所有编码示例、反编译器对比摘要表及分类代码手册,用于研究C语言反编译器的保真度问题。 文件详解 文件名称: codebook.pdf 文件格式: PDF 内容说明:...
-
HRIS_SaaS公司软件项目交付延迟预测数据集2024
2025年12月6日 30 76 16
数据集概述 本数据集包含从Jira提取的2024年史诗级项目历史记录,涵盖项目标识、状态、时间、团队等属性,经缺失值处理、特征工程等预处理,用于软件项目交付延迟的机器学习预测研究,支持复现或扩展相关研究结果。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: HRIS_Jira_Project_Dataset.zip - 文件格式:...



