JordanWylie,谭志远,AhmedAl-Dubai,王建珍
广州大学学报(自然科学版). 2020, 19(4): 28-41.
摘要 (
)
PDF全文 (
)
可视化
收藏
同一类别的Android恶意软件族,在操作和特征集上都极为相似.有效识别Android恶意软件类别,有利于解决恶意软件造成的破坏.集成学习通过策略性地组合多个机器学习模型的决策来解决智能计算问题,是一种被广泛推荐使用的智能决策方法.鉴于此,文章将集成学习方法应用于Android恶意软件族识别问题中,开发了一套基于集成学习的Android恶意软件分类原型系统,旨在改善和优化恶意软件识别系统的泛化能力,提高识别准确率.该原型使用了加权多数投票方法来确定各个学习模型(例如,支持向量机,K最近邻算法,Extra-Tress,多层感知器和Logistic回归)在最终决策过程中的权重.进一步使用公共恶意软件数据集Drebin、UpDroid以及从GitHub存储库中获取的最新样本对该原型系统进行评估.研究结果表明,集成学习方法并不总是比单一学习模型方法更好.其原因是基于集成学习的恶意软件族识别器的性能受多个因素影响,特别是特征、参数值和分配给各个模型的权重因素,这些对识别器的性能影响尤其重要,这也是文章今后的研究方向.