大语言模型分析与改进科学代码方法名数据集

数据集概述

本数据集是研究大语言模型在科学代码方法名分析与改进应用的配套数据,包含实验输出数据库、代码实现文件、提示词模板及项目说明文档,支持复现相关研究结果。

文件详解

  • 文件名称:ReadMe.md,文件格式:Markdown,内容:项目说明文档,介绍数据集对应的研究论文及各文件的用途。
  • 文件名称:LLM.db,文件格式:SQLite数据库,内容:存储大语言模型的输出结果及原始方法名数据集。
  • 文件名称:prompt.txt,文件格式:文本文件,内容:用于引导大语言模型分析Python方法代码的提示词模板。
  • 文件名称:code-analysis.zip,文件格式:压缩包,内容:可能包含科学代码方法名的分析相关源码及资源。
  • 文件名称:code-LLM.zip,文件格式:压缩包,内容:包含利用大语言模型评估和生成方法名的源码及相关笔记本文件。

适用场景

  • 软件工程研究:分析大语言模型在科学代码方法名优化中的效果。
  • 自然语言处理应用:探究大语言模型对代码文本的理解与生成能力。
  • 代码质量提升研究:研究自动方法名生成技术对代码可读性的影响。
  • 学术论文复现:支持复现“Exploring Large Language Models for Analyzing and Improving Method Names in Scientific Code”论文的实验结果。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.0 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。