-
科学编程代码理解研究初步见解数据集
2025年12月21日 30 68 51
数据集概述 本数据集为论文《Exploring Code Comprehension in Scientific Programming: Preliminary Insights from Research Scientists》的配套数据,包含研究相关的文档与资源压缩包,支持复现该研究对科研人员科学编程代码理解能力的分析。 文件详解...
-
Java代码可读性模型的以人为中心评估数据集
2025年12月18日 30 6 3
数据集概述 本数据集是论文《Reassessing Java Code Readability Models with a Human-Centered Approach》的配套代码与数据,包含研究概述文件和压缩包文件,为复现研究或深入分析Java代码可读性模型提供支持。 文件详解 该数据集包含两个文件,具体说明如下: - 文档文件: - study...
-
智能合约代码摘要数据集
2025年12月15日 30 112 0
数据集概述 该数据集包含智能合约代码摘要相关数据,核心为智能合约的方法与注释对原始数据,以及经处理的序列字典、数字索引输入和包含SBT序列、节点序列、邻接矩阵与注释的元组数据,为智能合约代码摘要研究提供支持。 文件详解 数据集包含两个压缩文件: contracts.zip:包含347,410条智能合约对原始数据...
-
数据集误用对语义克隆检测的影响研究补充材料
2025年12月12日 30 174 82
数据集概述 本数据集为研究“数据集误用如何影响语义克隆检测”的补充材料,包含手动调查所用的克隆对、调查协议、结果,以及基于大语言模型的数据集评估结果、文献分析代码和综述结果等内容,支持相关研究验证与复现。 文件详解 该数据集包含两个文件夹及相关文件,具体说明如下: - BCB406 文件夹: -...
-
代码异味数据集_DACOS
2025年12月10日 30 185 68
数据集概述 该数据集提供三类代码异味(多面抽象、复杂方法、长参数列表)的标注代码片段,包含人工标注的主观片段数据集及更大规模的明确良性或异味的代码片段集,通过SQL文件和源码压缩包形式存储。 文件详解...
-
GPT_4代码摘要局限性检验复现包
2025年12月4日 30 195 118
数据集概述 本数据集为GPT-4代码摘要局限性检验的复现包,包含相关研究的复现所需文件,以压缩包形式呈现,为验证GPT-4在代码摘要任务中的性能局限提供支持。 文件详解 文件名称: llm-code-understanding-replication-package.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
代码单元格类型与来源数据集
2025年7月14日 30 189 4
代码单元格类型与来源数据集_Code_Cell_Type_and_Source_Dataset 数据来源:互联网公开数据 标签:代码分析, 数据科学, 代码单元格, Jupyter Notebook, 文本处理, 机器学习, 数据预处理, 代码理解 数据概述: 该数据集包含来自Jupyter...
-
Gemma模型微调综合编码数据集-malakafaqahmad
2025年5月29日 30 160 129
Gemma模型微调综合编码数据集-malakafaqahmad 数据来源:互联网公开数据 标签:编码,数据集,机器学习,自然语言处理,Gemma,模型微调,代码生成,代码理解 数据概述:该数据集包含用于Gemma模型微调的综合编码数据,旨在提升模型在代码生成、代码理解等任务上的表现。主要特征如下:...
-
基于函数的功能亲和力预测数据集-hatimcodes
2025年5月29日 30 98 22
基于函数的功能亲和力预测数据集-hatimcodes 数据来源:互联网公开数据 标签:函数亲和力,软件工程,代码分析,机器学习,数据集,软件维护,代码理解,程序设计 数据概述: 该数据集包含了用于预测函数之间功能亲和力的数据,旨在辅助软件工程师理解代码结构,优化代码维护和重构。主要特征如下: 时间跨度: 数据更新时间不定,数据内容随软件项目变化而更新。...
-
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger
2025年5月29日 30 11 5
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger 数据来源:互联网公开数据 标签:代码生成,自然语言处理,深度学习,代码理解,软件工程,数据集,编程,文本生成 数据概述: 该数据集包含由CodeBERT模型生成的代码数据,用于代码生成任务。主要特征如下:...
-
代码理解与智能补全数据集CodeBERTDatasetforJust-in-TimeKnowledge-basedSemanticEnhancement-...
2025年5月29日 30 22 2
代码理解与智能补全数据集CodeBERTDatasetforJust-in-TimeKnowledge-basedSemanticEnhancement-vtrngthanh 数据来源:互联网公开数据 标签:自然语言处理,代码理解,智能补全,机器学习,语义增强,编程辅助,AI开发工具,软件工程 数据概述:...
-
编程问答文本分类数据集ProgrammingQ-ATextClassification-hanjunggeun
2025年5月20日 30 134 43
编程问答文本分类数据集ProgrammingQ-ATextClassification-hanjunggeun 数据来源:互联网公开数据 标签:文本分类, 编程问答, 代码理解, 意图识别, 自然语言处理, 机器学习, 代码分析, 语料库 数据概述: 该数据集包含来自在线编程问答社区的文本数据,记录了用户提出的问题及其对应的标签。主要特征如下:...
-
代码单元格预处理文本分析数据集CodeCellPreprocessedTextAnalysisDataset-bantencrues
2025年5月19日 30 108 85
代码单元格预处理文本分析数据集CodeCellPreprocessedTextAnalysisDataset-bantencrues 数据来源:互联网公开数据 标签:代码分析, 文本预处理, 自然语言处理, 代码理解, 机器学习, 数据挖掘, Jupyter Notebook, 代码片段 数据概述: 该数据集包含来自Jupyter...
-
代码摘要与函数解释数据集CodeSummarizationandFunctionExplanationDataset-mathav95raj
2025年5月18日 30 105 84
代码摘要与函数解释数据集CodeSummarizationandFunctionExplanationDataset-mathav95raj 数据来源:互联网公开数据 标签:代码摘要, 函数解释, 自然语言处理, 文本生成, Python, 机器学习, 代码理解, 数据集 数据概述:...
-
编程学习代码纠错与反馈数据集ProgrammingLearningCodeCorrectionandFeedbackDataset-shamindipathirathne
2025年5月17日 30 76 34
编程学习代码纠错与反馈数据集ProgrammingLearningCodeCorrectionandFeedbackDataset-shamindipathirathne 数据来源:互联网公开数据 标签:代码纠错, 编程教育, 机器学习, 自然语言处理, 文本生成, 学生反馈, 编程辅助, 代码理解 数据概述:...
-
数据2024年春季DSo数据集MDEbertaV3基础模型DSo2024SpringMDEbertaV3BaseDataset-ktakita
2025年5月16日 30 133 104
2024年春季DSo数据集MDEbertaV3基础模型DSo2024SpringMDEbertaV3BaseDataset-ktakita 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,代码理解,人工智能,技术文档 数据概述: 该数据集包含来自DSo2024春季项目的数据,主要记录了基于MDEberta...
-
IDL项目代码编码器数据集-courageekoh
2025年5月14日 30 2 1
IDL项目代码编码器数据集-courageekoh 数据来源:互联网公开数据 标签:代码编码,数据集,自然语言处理,机器学习,软件工程,代码生成,代码理解,人工智能 数据概述: 该数据集包含了IDL项目中的代码数据,主要用于代码编码和相关任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了IDL项目开发过程中的代码。...
-
编程代码生成与评估数据集ProgrammingCodeGenerationandEvaluationDataset-bekhtinav
2025年5月1日 30 104 36
编程代码生成与评估数据集ProgrammingCodeGenerationandEvaluationDataset-bekhtinav 数据来源:互联网公开数据 标签:代码生成, 编程, 文本生成, 机器学习, 代码评估, 数据集, 自然语言处理, 代码理解 数据概述:...
-
软件代码注释分类数据集SoftwareCodeCommentClassificationDataset-mushfiqurrahman6087
2025年5月1日 30 138 23
软件代码注释分类数据集SoftwareCodeCommentClassificationDataset-mushfiqurrahman6087 数据来源:互联网公开数据 标签:代码注释, 文本分类, 软件工程, 机器学习, 自然语言处理, 代码理解, 注释分析, 软件维护 数据概述:...
-
代码语法类型标注数据集CodeSyntaxTypeAnnotationDataset-bestbars
2025年5月1日 30 153 150
代码语法类型标注数据集CodeSyntaxTypeAnnotationDataset-bestbars 数据来源:互联网公开数据 标签:代码分析, 语法类型, 文本分类, 数据标注, 机器学习, 自然语言处理, 软件工程, 代码理解 数据概述: 该数据集包含代码片段的语法类型标注信息,记录了代码中不同部分的语法结构类别。主要特征如下:...



