代码安全漏洞检测数据集CodeSecurityVulnerabilityDetection-enarior

代码安全漏洞检测数据集CodeSecurityVulnerabilityDetection-enarior

数据来源:互联网公开数据

标签:代码安全, 漏洞检测, 文本分类, 机器学习, CVE, 代码审计, 安全分析, 软件工程

数据概述: 该数据集包含来自代码安全审计与漏洞修复的数据,记录了用于检测代码中潜在安全漏洞的代码片段示例。主要特征如下: 时间跨度:数据未标明具体时间,视作静态代码片段数据集使用。 地理范围:数据为全球范围内软件开发场景下的代码示例,侧重于安全漏洞相关的代码片段。 数据维度:包括“code”(代码片段)和“label”(分类标签,0代表安全代码,1代表存在安全漏洞的代码)两个字段,适用于二分类任务。 数据格式:CSV格式,文件名为cvefixes_diff_under_512.csv,便于文本处理和建模分析。 来源信息:数据来源于代码安全审计与漏洞修复相关项目,已进行代码片段提取与标签标注。 该数据集适合用于代码安全漏洞检测、恶意代码识别和安全代码规范研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于软件工程、网络安全与人工智能交叉领域的学术研究,如代码漏洞自动检测、恶意代码识别、代码相似度分析等。 行业应用:为软件开发行业提供数据支持,尤其适用于静态代码分析工具(SAST)、安全漏洞扫描器、代码质量检测工具等产品的模型训练与测试。 决策支持:支持软件开发过程中的安全风险评估与代码质量控制,助力企业提升软件安全性。 教育和培训:作为软件安全、代码审计、机器学习课程的实训数据,用于学生训练模型、了解代码漏洞模式。 此数据集特别适合用于探索代码漏洞的模式与特征,帮助用户实现自动化漏洞检测、提升代码安全防护能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 10, 2025, 00:20 (UTC)
创建于 五月 10, 2025, 00:20 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。