数据集概述
本数据集是LAMeD项目的补充材料,包含LLM生成的内存泄漏检测标注相关文件,用于支持内存泄漏检测任务的研究与分析。数据集共3个文件,涵盖管道代码、标注CSV及基准测试JSON三类内容,无训练测试或数据标签拆分。
文件详解
- 文件名称:lamed-pipeline.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包文件,推测包含LAMeD项目的相关管道代码或流程文件,具体内容需解压后查看
- 文件名称:сJSON-annotated.csv
- 文件格式:CSV
- 字段映射介绍:包含method_name(方法名)、ALLOC(是否分配内存)、DEALLOC(是否释放内存)三个字段,记录cJSON相关方法的内存操作标注
- 文件名称:memleak_benchmark.json
- 文件格式:JSON
- 字段映射介绍:内存泄漏基准测试相关的JSON文件,具体字段需解析文件内容后查看
适用场景
- 内存泄漏检测研究:用于分析LLM生成标注在内存泄漏检测任务中的效果与性能
- 代码静态分析:基于CSV中的内存操作标注,优化代码静态分析工具对内存泄漏的识别能力
- 基准测试构建:利用JSON基准测试文件,构建或验证内存泄漏检测模型的评估基准
- 软件质量保障:辅助开发人员识别代码中的内存泄漏风险点,提升软件稳定性