The detection of malware is a critical task for the protection of computing environments. This task often requires extremely low false positive rates (FPR) of 0.01% or even lower, for which modern machine learning has no readily available tools. We introduce the first broad investigation of the use of uncertainty for malware detection across multiple datasets, models, and feature types. We show how ensembling and Bayesian treatments of machine learning methods for static malware detection allow for improved identification of model errors, uncovering of new malware families, and predictive performance under extreme false positive constraints. In particular, we improve the true positive rate (TPR) at an actual realized FPR of 1e-5 from an expected 0.69 for previous methods to 0.80 on the best performing model class on the Sophos industry scale dataset. We additionally demonstrate how previous works have used an evaluation protocol that can lead to misleading results.


翻译:检测恶意软件是保护计算环境的一项关键任务。 这项任务通常要求极低的假正率(FPR)为0.01%甚至更低,而现代机器学习没有现成的工具。 我们首次广泛调查在多个数据集、模型和特征类型中使用不确定性检测恶意软件的问题。 我们展示了对固定恶意软件检测的机器学习方法进行组合和巴耶斯处理如何改进模型错误识别,发现新的恶意软件家庭,以及在极端假正值限制下预测性能。 特别是,我们提高了实际实现的1e-5实际正率(TPR),从预期的0.69(以前的方法为0.69)提高到0.80( Sophos 行业规模数据集最佳运行模型类别)。 我们还进一步展示了以往的工程如何使用评价协议导致误导结果。

0
下载
关闭预览

相关内容

专知会员服务
20+阅读 · 2021年7月28日
专知会员服务
42+阅读 · 2020年12月18日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
已删除
将门创投
5+阅读 · 2019年4月4日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
carla 学习笔记
CreateAMind
9+阅读 · 2018年2月7日
Arxiv
0+阅读 · 2021年10月6日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
3+阅读 · 2018年6月5日
VIP会员
相关资讯
已删除
将门创投
5+阅读 · 2019年4月4日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
carla 学习笔记
CreateAMind
9+阅读 · 2018年2月7日
Top
微信扫码咨询专知VIP会员