数据集概述
本数据集包含来自MOCDroid研究论文的安卓应用导入包信息,涵盖9383个恶意软件应用和9430个良性软件应用的导入包集合。每个应用对应一行数据,记录了该应用使用的所有导入包信息。数据可用于分析恶意软件与良性软件在代码依赖和API调用模式上的差异。
文件详解
- MOCDroid/imports_malware.csv
- 文件格式: CSV
- 字段映射介绍: 包含9383个恶意软件应用的导入包信息,每行代表一个应用的所有导入包集合,如javax.microedition.lcdui.image、javax.microedition.lcdui.font等。
- MOCDroid/imports_benignware.csv
- 文件格式: CSV
- 字段映射介绍: 包含9430个良性软件应用的导入包信息,每行代表一个应用的所有导入包集合,如com.google.android.gms.games.quest.questupdate.listener、com.google.android.gms.internal.zzfgzza等。
数据来源
论文"MOCDroid",发表于http://link.springer.com/article/10.1007/s00500-016-2283-y
适用场景
- 安卓恶意软件检测: 通过分析恶意软件与良性软件在导入包使用模式上的差异,构建基于导入包特征的恶意软件检测模型。
- 代码依赖分析: 研究不同类型安卓应用在API调用和第三方库依赖方面的特征模式。
- 移动应用安全研究: 识别恶意软件常用的特定导入包组合,为移动应用安全分析提供参考依据。
- 机器学习特征工程: 将导入包信息转化为特征向量,用于训练分类器识别应用的安全性。