Long-Short-Term-Memory (LSTM) networks have shown great promise in artificial intelligence (AI) based language modeling. Recently, LSTM networks have also become popular for designing AI-based Intrusion Detection Systems (IDS). However, its applicability in IDS is studied largely in the default settings as used in language models. Whereas security applications offer distinct conditions and hence warrant careful consideration while applying such recurrent networks. Therefore, we conducted one of the most exhaustive works on LSTM hyper-parameters for IDS and experimented with approx. 150 LSTM configurations to determine its hyper-parameters relative importance, interaction effects, and optimal selection approach for designing an IDS. We conducted multiple analyses of the results of these experiments and empirically controlled for the interaction effects of different hyper-parameters covariate levels. We found that for security applications, especially for designing an IDS, neither similar relative importance as applicable to language models is valid, nor is the standard linear method for hyper-parameter selection ideal. We ascertained that the interaction effect plays a crucial role in determining the relative importance of hyper-parameters. We also discovered that after controlling for the interaction effect, the correct relative importance for LSTMs for an IDS is batch-size, followed by dropout ratio and padding. The findings are significant because when LSTM was first used for language models, the focus had mostly been on increasing the number of layers to enhance performance.


翻译:长期短期计量(LSTM)网络在人工智能(AI)基础语言模型方面显示出很大的希望。最近,LSTM网络在设计基于AI的入侵探测系统方面也变得很受欢迎。然而,在语言模型中使用的默认情况下,对它是否适用于IDS进行了研究。虽然安全应用提供了不同的条件,因此在应用这种经常性网络时值得仔细考虑。因此,我们为IDS进行了LSTM超参数最详尽的工作之一,并试验了约150 LSTM配置,以确定其超参数相对重要性、互动效应和设计IDS的最佳选择方法。我们对这些实验的结果进行了多次分析,并对不同超参数的相异水平的互动效果进行了经验性控制。我们发现,对于安全应用,特别是设计与语言模型无关的相对重要性,对于超参数模型选择理想而言,我们进行了最详尽的标准线性方法。我们确定,互动效应在决定超参数的相对重要性、互动效果和设计综合数据基础设施的最佳选择方法方面发挥着至关重要的作用。我们对这些实验的结果进行了多次分析,对不同超参数的相互作用的影响进行了经验性控制。我们发现,因为I在使用了高水平后,对不断提高的比比重的等级的等级的分辨率的比重影响是。

0
下载
关闭预览

相关内容

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来,这些会议吸引了来自几个国家和文化的研究人员。官网链接:http://interact2019.org/
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
【Google论文】ALBERT:自我监督学习语言表达的精简BERT
专知会员服务
24+阅读 · 2019年11月4日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
已删除
架构文摘
3+阅读 · 2019年4月17日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
3+阅读 · 2018年12月29日
Arxiv
3+阅读 · 2018年1月31日
VIP会员
相关资讯
已删除
架构文摘
3+阅读 · 2019年4月17日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员