-
Stack_Overflow_Based_开发者代码使用行为研究编码数据
2026年1月22日 30 168 60
数据集概述 本数据集为学术论文《How Do Developers Utilize Source Code from Stack Overflow?》的配套编码数据,包含开发者调查响应、开放式回答分类及多语言代码使用编码三类文件,记录了开发者使用Stack Overflow代码的行为特征与相关属性,可用于分析开发者代码复用模式与偏好。 文件详解...
-
Source_Code_Classifications_编程语言分类代码数据集
2026年1月19日 30 21 3
数据集概述 本数据集为编程语言分类代码数据集,核心内容是与编程语言分类相关的源代码数据,以压缩包形式提供,未包含训练测试、数据标签或原始处理等划分,无额外说明文档或内容预览。 文件详解 主文件 文件名称:dataset.zip 文件格式:ZIP...
-
C语言代码片段及其标签数据集CCodeSnippetsandTheirLabelsDataset-shirshaka
2025年5月28日 30 167 12
C语言代码片段及其标签数据集CCodeSnippetsandTheirLabelsDataset-shirshaka 数据来源:互联网公开数据 标签:编程,代码分析,数据集,机器学习,自然语言处理,软件工程,代码标签,代码分类 数据概述: 该数据集包含来自多个开源项目和代码库的C语言代码片段及其对应的标签。主要特征如下:...
-
代码片段分类数据集CodeSnippetClassificationDataset-dminhvu474
2025年5月16日 30 93 36
代码片段分类数据集CodeSnippetClassificationDataset-dminhvu474 数据来源:互联网公开数据 标签:代码片段, 文本分类, 机器学习, 软件测试, 代码分析, Java, 数据集, one-hot编码 数据概述: 该数据集包含来自软件测试领域的代码片段,用于训练和评估文本分类模型。主要特征如下:...
-
代码缺陷检测数据集CodeDefectDetectionDataset-mrutyunjaybiswal
2025年5月7日 30 189 9
代码缺陷检测数据集CodeDefectDetectionDataset-mrutyunjaybiswal 数据来源:互联网公开数据 标签:代码分析, 缺陷检测, 软件工程, 机器学习, 代码分类, 自然语言处理, 源代码, 深度学习 数据概述: 该数据集包含来自不同编程语言的源代码片段,用于训练和评估代码缺陷检测模型。主要特征如下:...
-
代码资源来源数据集CodeJit-SourceDataset-ducanger
2025年4月25日 30 43 26
代码资源来源数据集CodeJit-SourceDataset-ducanger 数据来源:互联网公开数据 标签:软件开发,代码资源,数据集,文本分析,机器学习,编程语言,开源资源,数据挖掘 数据概述: 该数据集包含来自CodeJit开源平台的代码资源数据,记录了多种编程语言的项目代码,文档和元信息。主要特征如下:...



