【泡泡一分钟】SUBIC: 一种用于图像搜索的有监督的,结构化二进制编码(ICCV2017-78)

2018 年 9 月 9 日 泡泡机器人SLAM

每天一分钟,带你读遍机器人顶级会议文章

标题:SUBIC: A supervised, structured binary code for image search


作者:Himalaya Jain, Joaquin Zepeda, Patrick Perez, and Remi Gribonval

来源:ICCV 2017 ( IEEE International Conference on Computer Vision)

播音员:阿晨

编译:杨雨生(87)

欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权


摘要

        对于大规模图像搜索,其关键在于图像的高度压缩表达方式。基于乘积量化及其变体的结构向量量化器通常用于实现这样的压缩,同时可以最小化精度的损失。但是,与二进制哈希算法不同,这种方法是无监督的,其并没有收益于深度学习发展带来的有监督方法,端对端学习和新的架构。作者提出一种新的方法,采用深度卷积神经网络产生有监督的,紧凑的,结构化的二进制编码用于图像搜索。作者的方法利用block-softmax分类器的非线性特征和基于batch的熵损失,从学习到的编码中提取出结构特征。作者验证了其算法在单个类别或多类别分类检索,实例检索和分类方面,优于现有的基于深度哈希或结构量化的紧凑表示方法。作者将其代码和模型在网上进行了公开。



        上图是作者提出的神经网络的结构图。


作者项目的GitHub网址为

https://github.com/technicolor-research/subic

  Abstract

For large-scale visual search, highly compressed yet meaningful representations of images are essential. Structured vector quantizers based on product quantization and its variants are usually employed to achieve such compression while minimizing the loss of accuracy. Yet, unlike binary hashing schemes, these unsupervised methods have not yet benefited from the supervision, end-to-end learning and novel architectures ushered in by the deep learning revolution. We hence propose herein a novel method to make deep convolutional neural networks produce supervised, compact, structured binary codes for visual search. Our method makes use of a novel block-softmax nonlinearity and of batch-based entropy losses that together induce structure in the learned encodings. We show that our method outperforms state-of-the-art compact representations based on deep hashing or structured quantization in single and cross-domain category retrieval, instance retrieval and classification. We make our code and models publicly available online.



如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【泡泡机器人SLAM】公众号(paopaorobot_slam)

欢迎来到泡泡论坛,这里有大牛为你解答关于SLAM的任何疑惑。

有想问的问题,或者想刷帖回答问题,泡泡论坛欢迎你!

泡泡网站:www.paopaorobot.org

泡泡论坛:http://paopaorobot.org/forums/


泡泡机器人SLAM的原创内容均由泡泡机器人的成员花费大量心血制作而成,希望大家珍惜我们的劳动成果,转载请务必注明出自【泡泡机器人SLAM】微信公众号,否则侵权必究!同时,我们也欢迎各位转载到自己的朋友圈,让更多的人能进入到SLAM这个领域中,让我们共同为推进中国的SLAM事业而努力!

商业合作及转载请联系liufuqiang_robot@hotmail.com

登录查看更多
0

相关内容

ICCV 的全称是 IEEE International Conference on Computer Vision,即国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,被澳大利亚ICT学术会议排名和中国计算机学会等机构评为最高级别学术会议,在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低,是三大会议中公认级别最高的。ICCV会议时间通常在四到五天,相关领域的专家将会展示最新的研究成果。
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
61+阅读 · 2020年6月25日
专知会员服务
50+阅读 · 2020年6月14日
【ICML2020】多视角对比图表示学习,Contrastive Multi-View GRL
专知会员服务
80+阅读 · 2020年6月11日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
知识图谱本体结构构建论文合集
专知会员服务
107+阅读 · 2019年10月9日
【泡泡一分钟】学习多视图相似度(ICCV-2017)
泡泡机器人SLAM
10+阅读 · 2018年10月7日
【泡泡一分钟】学习紧密的几何特征(ICCV2017-17)
泡泡机器人SLAM
20+阅读 · 2018年5月8日
【泡泡一分钟】端到端的弱监督语义对齐
泡泡机器人SLAM
53+阅读 · 2018年4月5日
Precise Detection in Densely Packed Scenes
Arxiv
3+阅读 · 2019年4月8日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
5+阅读 · 2018年3月6日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员