RDiverseVul_Refined_DiverseVul数据集

数据集概述

本数据集是原始DiverseVul数据集的优化版本,通过移除重复条目及错误数据生成。原始数据中存在七千九百零一条重复记录,包括完全由注释组成的条目、代码相同但函数名不同且标签相反的条目等问题数据。优化后数据集仅包含一个文件。

文件详解

  • 文件名称:RDiverseVul.json
  • 文件格式:JSON
  • 字段映射介绍:未提供具体字段映射信息,文件为优化后的DiverseVul数据集内容,包含经过去重和错误修正后的漏洞相关数据。

适用场景

  • 软件漏洞检测模型训练: 用于训练和评估漏洞检测算法的性能。
  • 代码重复检测研究: 分析代码重复对漏洞检测结果的影响。
  • 软件安全数据分析: 支持软件安全领域的数据分析和研究。
  • 数据集质量优化研究: 作为数据集去重和错误修正的案例,用于研究数据集质量优化方法。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 470.36 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。