本文由腾讯优图实验室和中科院软件所联合提出。细粒度视觉分类(Fine-Grained Visual Categorization,FGVC)因样本类间差异更加细微,往往只能借助微小的局部差异才能区分出不同的类别,使其成为一项重要但具有挑战性的任务。本文提出了一种基于注意力机制的卷积二叉神经树结构。具体来说,我们将传统的决策树与神经网络结合,在树的内部节点中使用路由来确定树内从根到叶的计算路径,并且在树的边上添加了卷积操作增强表示学习,最终决策融合了所有叶节点的预测。该模型以一种由粗到细的层次方式学习具有判别力的特征。此外,我们采用了非对称的策略来增加多尺度特征提取,增强样本的区分性特征表示。我们采用SGD优化方法以端到端的方式训练整个网络。我们的方法在CUB-200-2011,Stanford Cars 和 Aircraft数据集上进行了评估,显著优于当前其他的弱监督细粒度方法。

成为VIP会员查看完整内容
24

相关内容

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. http://cvpr2020.thecvf.com/
【CVPR2020】时序分组注意力视频超分
专知会员服务
30+阅读 · 2020年7月1日
【CVPR2020-旷视】DPGN:分布传播图网络的小样本学习
专知会员服务
26+阅读 · 2020年4月1日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【泡泡一分钟】一种用于在线视频理解的高效卷积网络
泡泡机器人SLAM
5+阅读 · 2018年5月31日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
22+阅读 · 2018年2月14日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
6+阅读 · 2017年12月2日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关论文
Arxiv
9+阅读 · 2018年10月18日
Arxiv
22+阅读 · 2018年2月14日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
6+阅读 · 2017年12月2日
Arxiv
5+阅读 · 2015年9月14日
微信扫码咨询专知VIP会员