国家漏洞数据库与受影响库漏洞报告数据集1963-2021
数据来源:互联网公开数据
标签:漏洞报告,国家漏洞数据库,受影响库,开源漏洞,网络安全,技术分析
数据概述:
本数据集包含了从国家漏洞数据库(NVD)提取的漏洞报告文本,以及从开源漏洞数据库(OSV)收集的受影响库信息。数据集包含三个文件:nvd.csv、osv.csv 和 labeled.csv。
nvd.csv 文件包含了从 NVD 提取的漏洞报告文本,共包含 4 列:id、description、references 和 configurations。id 字段指定了漏洞报告的 CVE 编号,其他字段包含了从对应部分的漏洞报告中提取的文本。
osv.csv 文件包含了每个漏洞报告受影响的库信息。id 字段包含 CVE 编号,affected 字段包含受影响库的列表。
数据集中共有 159,810 条包含受影响库的漏洞报告,31,118 条未标注任何库的漏洞报告(这些报告同时出现在 nvd.csv 和 osv.csv 中),并且涉及总计 22,181 个不同的库。
labeled.csv 文件包含了从 nvd.csv 和 osv.csv 中合并处理后的数据。text 字段包含了 description、references 和 configurations 的合并文本,target 列包含标注的受影响库,以空格分隔的整数字符串表示。每个库对应唯一的整数。
数据用途概述:
该数据集适用于漏洞分析、网络安全研究、软件库安全性评估等多种场景。研究人员可以利用此数据集进行技术分析,识别和理解各种漏洞的影响;开发人员可以借助数据评估其使用的库的安全性;安全机构可以利用数据识别潜在的安全威胁并制定相应的防护策略。此外,该数据集也适合用于教育培训,帮助学习者了解漏洞管理和网络安全的基本原理。