【ICLR2020】胶囊与反向路由点积注意力

2020 年 2 月 15 日 专知

题目:Capsules with Inverted Dot-Product Attention Routing

摘要:我们设计了一种新的胶囊网络路由算法,其中低层胶囊仅根据高层的状态和低层的投票之间的协议路由到高层。新机制1)设计反向路由点积注意力;2) 强制层规范化作为规范化;和 3)将顺序迭代路由替换为并发迭代路由。与之前提出的路由算法相比,我们的方法提高了基准数据集(如 CIFAR-10 和 CIFAR-100)的性能,并且其性能与功能强大的 CNN (ResNet-18) 相同,参数减少了 4 倍。在从叠加数字图像中识别数字的任务中,提出的的胶囊模型在给定每层相同数量的层和神经元的情况下,对比 CNN 具有优异的性能。我们认为,我们的工作提高了将胶囊网络应用于复杂的实际任务的可能性。

地址:https://arxiv.org/pdf/2002.04764.pdf

代码:https://github.com/apple/ml-capsules-inverted-attention-routing

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CAPS” 就可以获取胶囊与反向路由点积注意力》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【ICML2020】对比多视角表示学习
专知会员服务
52+阅读 · 2020年6月28日
【ICLR 2019】双曲注意力网络,Hyperbolic  Attention Network
专知会员服务
82+阅读 · 2020年6月21日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
77+阅读 · 2020年5月24日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【资源】NLP深度生成模型会议/论文列表
专知
9+阅读 · 2019年11月19日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
6+阅读 · 2019年4月8日
Arxiv
9+阅读 · 2018年5月24日
Arxiv
3+阅读 · 2017年8月15日
VIP会员
Top
微信扫码咨询专知VIP会员