SQL注入攻击检测机器学习训练完整数据集

数据集概述

本数据集专门用于训练监督式机器学习算法识别SQL注入威胁。数据集包含47,464条独特的SQL查询语句,其中25,800条为良性查询,21,664条为恶意查询。每条记录均包含完整的SQL查询组件,如分号、单引号、中间数据、文本片段和SQL关键词。数据集采用二进制标签标注,恶意查询标记为1,正常查询标记为0。此外,数据集还提取了18个数值特征,用于提升机器学习算法的准确性和精确度。

文件详解

  • SQL注入攻击数据集主文件
  • 文件名称:SQLI_Dataset.csv
  • 文件格式:CSV
  • 字段映射介绍:包含19个特征列,其中1个为标签列(0表示正常查询,1表示恶意查询),18个为独立数值特征列,具体包括:
  • 无字母数量、无数字数量、无特殊字符数量、无关键词数量
  • 查询长度、信息熵值
  • 分号数量、单引号数量、双引号数量、百分号数量
  • 空白字符数量、标点符号数量
  • 逻辑运算符数量、运算符数量、OR运算符数量、AND运算符数量
  • 注释数量

数据来源

Kaggle和GitHub平台

适用场景

  • SQL注入威胁检测: 用于训练和评估机器学习模型识别恶意SQL查询语句的能力
  • 网络安全算法研究: 为开发新型SQL注入检测算法提供标准化的训练和测试数据
  • 特征工程研究: 分析不同SQL查询特征对检测准确性的影响,优化特征选择策略
  • 教育训练: 作为网络安全课程中SQL注入检测技术的实践教学材料
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.53 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。