Recent work on efficient neural network architectures focuses on discovering a solitary network that can achieve superior computational efficiency and accuracy. While this paradigm has yielded impressive results, the search for novel architectures usually requires significant computational resources. In this work, we demonstrate a simple complementary paradigm to obtain efficient and accurate models that requires no architectural tuning. We show that committee-based models, i.e., ensembles or cascades of models, can easily obtain higher accuracy with less computation when compared to a single model. We extensively investigate the benefits of committee-based models on various vision tasks and architecture families. Our results suggest that in the large computation regime, model ensembles are a more cost-effective way to improve accuracy than using a large solitary model. We also find that the computational cost of an ensemble can be significantly reduced by converting them to cascades, while often retaining the original accuracy of the full ensemble.


翻译:最近关于高效神经网络架构的工作侧重于发现一个能够实现更高计算效率和准确度的单独网络。虽然这一模式已经取得了令人印象深刻的成果,但寻找新建筑通常需要大量的计算资源。在这项工作中,我们展示了一个简单的互补范例,以获得不需要任何建筑调整的高效和准确模型。我们表明,基于委员会的模型,即模型组合或模型级联,与单一模型相比,很容易获得更高的准确度,而计算率则较低。我们广泛研究了基于委员会的模型对各种愿景任务和建筑家庭的益处。我们的结果表明,在大型计算制度中,模型组合比使用大型单独模型更符合成本效益地提高了准确性。我们还发现,通过将其转换成级联,可以大幅降低一个共同体的计算成本,同时往往保留全部组合的原始准确性。

0
下载
关闭预览

相关内容

机器学习系统设计系统评估标准
最新《Transformers模型》教程,64页ppt
专知会员服务
309+阅读 · 2020年11月26日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
129+阅读 · 2020年5月14日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
已删除
将门创投
3+阅读 · 2019年11月25日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
3+阅读 · 2018年10月5日
Deep Randomized Ensembles for Metric Learning
Arxiv
5+阅读 · 2018年9月4日
VIP会员
Top
微信扫码咨询专知VIP会员