数据集概述
该数据集围绕恶意软件与正常应用的数据流权限展开,包含多维度的数据流频率分析图表及数据文件,基于MalGenome项目的恶意软件分类,对比不同层级聚合的数据流在恶意类别与正常应用中的分布特征。
文件详解
- 数据文件(CSV格式):
- DistinctApksWNormalFlowCategoryLvl0.csv:记录完整数据流名称的频率数据,字段包括Category(类别)、Flow Source(数据流源)、Flow Sink(数据流 sink)、Distinct APK count(不同APK数量)、Total Distinct APKs(总不同APK数)
- DistinctApksWNormalFlowCategoryLvl1.csv:记录一级聚合数据流的频率数据,字段同上
- DistinctApksWNormalFlowCategoryLvl2.csv:记录二级聚合数据流的频率数据,字段同上
- DistinctApksWNormalFlowCategoryLvl3.csv:记录三级聚合数据流的频率数据,字段同上
- 图表文件(PNG格式):
- normVmalWeightedPlot0Vert.png:完整数据流名称的频率对比图
- normVmalWeightedPlot1Vert.png:一级聚合数据流的频率对比图
- normVmalWeightedPlot2Vert.png:二级聚合数据流的频率对比图
- normVmalWeightedPlot3Vert.png:三级聚合数据流的频率对比图
- 说明文件(TXT格式):
- README.txt:数据集基本说明,包含来源信息
数据来源
OpenScience tera-PROMISE repository
适用场景
- 恶意软件检测研究:分析恶意软件与正常应用的数据流权限差异
- 安卓应用安全分析:识别不同层级聚合的敏感数据流特征
- 移动安全策略制定:基于数据流频率分布优化权限管控规则
- 恶意软件分类研究:对比不同恶意软件类别的数据流模式差异