题目:Capsules with Inverted Dot-Product Attention Routing
摘要:我们设计了一种新的胶囊网络路由算法,其中低层胶囊仅根据高层的状态和低层的投票之间的协议路由到高层。新机制1)设计反向路由点积注意力;2) 强制层规范化作为规范化;和 3)将顺序迭代路由替换为并发迭代路由。与之前提出的路由算法相比,我们的方法提高了基准数据集(如 CIFAR-10 和 CIFAR-100)的性能,并且其性能与功能强大的 CNN (ResNet-18) 相同,参数减少了 4 倍。在从叠加数字图像中识别数字的任务中,提出的的胶囊模型在给定每层相同数量的层和神经元的情况下,对比 CNN 具有优异的性能。我们认为,我们的工作提高了将胶囊网络应用于复杂的实际任务的可能性。 地址:https://arxiv.org/pdf/2002.04764.pdf
代码:https://github.com/apple/ml-capsules-inverted-attention-routing