本文提出了一种新的基于注意力的自适应计算算法DACT,与现有算法不同,DACT是端到端可微的。我们的方法可以与许多网络结合使用;具体来说,我们研究了它在众所周知的MAC体系结构中的应用,它大大减少了实现相似精度所需的重复步骤,因此提高了它的性能与计算率。此外,我们还表明,通过增加所使用的最大步数,我们甚至超过了CLEVR数据集中最好的非自适应MAC的准确性,这表明我们的方法能够控制步数而不会有显著的性能损失。我们的方法提供的其他优势包括通过丢弃无用的步骤来显著提高可解释性,并提供对底层推理过程的更多洞察。最后,我们将自适应计算等价于模型的集合,类似于专家公式的混合。我们的实验代码和配置文件都可以用于支持这一领域的进一步研究。

成为VIP会员查看完整内容
12

相关内容

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
34+阅读 · 2020年7月5日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
【CVPR2020】用多样性最大化克服单样本NAS中的多模型遗忘
【CVPR2020-谷歌】多目标(车辆)跟踪与检测框架 RetinaTrack
专知会员服务
44+阅读 · 2020年4月10日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
【CVPR2020】L2 ^GCN:图卷积网络的分层学习高效训练
专知会员服务
37+阅读 · 2020年3月31日
CVPR 2020 | 深度视觉推理2.0:组合式目标指代理解
AI科技评论
15+阅读 · 2020年3月20日
《常用算法之智能计算 (五) 》:模糊计算
数盟
9+阅读 · 2018年12月24日
论文浅尝 | 端到端神经视觉问答之上的显式推理
开放知识图谱
7+阅读 · 2018年6月28日
Arxiv
6+阅读 · 2019年4月8日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
7+阅读 · 2018年2月26日
Arxiv
10+阅读 · 2018年2月4日
VIP会员
微信扫码咨询专知VIP会员