-
源代码注释中960万链接研究数据集
2025年12月10日 30 125 113
数据集概述 本数据集为ICSE'19论文的研究工件,包含九百六十五万四千七百零二条源代码注释中的链接数据,关联语言及注释位置信息(含GitHub账户、仓库、提交哈希等),支持论文定量结果复现与软件工程研究复用。 文件详解 LICENSE.md: Markdown格式,可能包含数据集使用许可条款 README.md:...
-
代码异味数据集_DACOS
2025年12月10日 30 56 34
数据集概述 该数据集提供三类代码异味(多面抽象、复杂方法、长参数列表)的标注代码片段,包含人工标注的主观片段数据集及更大规模的明确良性或异味的代码片段集,通过SQL文件和源码压缩包形式存储。 文件详解...
-
开源项目代码风格与最佳编程实践采纳及演化实验数据集2025
2025年12月7日 30 196 12
数据集概述 本数据集为开源项目代码风格与最佳编程实践采纳及演化的实验数据,支撑ICSME 2025会议论文研究,记录相关实践的采纳情况与演化过程,为软件维护与演化领域研究提供数据支持。 文件详解 文件名称:kupari-ICSME-2025.zip 文件格式:ZIP压缩包(.zip)...
-
开源系统代码异味及其搭配大型实验数据集
2025年12月7日 30 43 18
数据集概述 本数据集包含从Qualitas Corpus(QC)获取的含代码异味的类数据,按QC版本和领域分类存储,同时提供PCA分析结果。数据依据检测工具数量的不同阈值(25%、50%、75%)区分文件,以0/1标识类中是否存在代码异味,支持代码异味相关研究。 文件详解 该数据集为一个ZIP压缩包,内部包含多个子文件夹和文件,具体说明如下: -...



