恶意软件与良性软件行为特征数据集-emish8

恶意软件与良性软件行为特征数据集-emish8 数据来源:互联网公开数据 标签:恶意软件,良性软件,行为分析,沙箱,Windows,机器学习,安全,词袋模型,特征提取 数据概述: 本数据集包含恶意软件(标记为-1)和良性软件(标记为1)在沙箱环境(Flare VM - Windows 10)中运行产生的行为日志数据,由作者生成。数据采用词袋模型(Bag of Words)技术,将行为日志转化为词频统计矩阵。每行代表一个软件样本,每列代表一个词语(即行为特征),单元格中的数值表示该词语在对应软件样本的日志中出现的次数。数据由作者基于Ricardo Calix在相关课程中使用的技术生成,但具体实现有所不同。 数据用途概述: 该数据集主要用于恶意软件检测、行为分析、机器学习模型训练等场景。研究人员可以利用此数据训练分类模型,以区分恶意软件和良性软件;安全工程师可以利用该数据分析恶意软件的行为特征,提升对恶意软件的识别能力;教育工作者可以将其作为案例,用于讲解恶意软件分析和机器学习等相关知识。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.33 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。