【新知】NIPS2017自动化所提出深度离散哈希算法 图像检索效果超越现最好方法

2017 年 11 月 3 日 中国科学院自动化研究所

【导读】被誉为神经计算和机器学习领域两大顶级会议之一的 NIPS(另一个为 ICML)近日揭晓收录论文名单,中科院自动化所李琦、孙哲南、赫然、谭铁牛论文「Deep supervised discrete hashing」被收录。文章新提出了一种深度离散哈希算法(discrete hashing algorithm )。实验结果表明,该方法在基准数据集上的表现要好过目前最好的哈希方法。


图1 深度离散哈希编码示意图


由于网络上的图像和视频数据的快速增长,哈希算法(Hashing)在近几年间引起了极大的关注。由于其较低的计算成本和较高的存储效率,是图像搜索和视频搜索中最常使用的技术之一。 一般来说,哈希算法可将高维数据编码为一组二进制代码,与此同时还能保持图像或视频的相似性。现有哈希算法可以大致分为两类:数据无关的方法和数据有关的方法。


近期有人提出了基于深度学习的哈希算法,它可以同时学习图像表示和哈希编码(hash coding),取得了比传统哈希算法更好的结果。「CNNH」是早期将深层神经网络与哈希编码融合的工作之一,该工作包括两个阶段来学习图像特征表示和哈希编码。 CNNH 的一个缺点是通过学习得到的图像特征表示不能及时反馈给哈希编码。为了克服 CNNH 的这一缺陷,「NetworkIn Network Hashing/NINH」提出了基于三元组损失函数来表示图像的相似性。研究表明,图像特征表示和哈希编码可以在一个框架内相互促进。DSRH 算法通过保留多标签图像间的相似语义信息来学习哈希函数。近年来还提出了其他基于排序的深度哈希算法。除了基于三元组排序方法外,还有一些基于成对标签的深度哈希算法。 

 

在该论文中,作者对其具体做法进行总结如下:「1」我们方法的最后一层输出直接限制为二进制编码。 学习到的二进制编码既能保持图像之间的相似关系,同时又能和标签信息保持一致。 据我们所知,该方法是第一个在统一框架下同时使用成对标签信息和分类信息学习哈希编码的方法。「2」为了减少量化误差,我们在优化过程中保留了哈希编码的离散化这一特性。此外,我们还提出了一种交替优化方法,即使用坐标下降法优化目标函数。「3」大量的实验结果表明,我们的方法在图像检索问题上,取得了比现最好方法更好的结果,从而验证了我们方法的有效性。 

图2:DSDH-A、DSDH-B、DSDH-C 和 DSDH 在 CIFAR-10上得到的结果:「a」Hamming 半径为 2 的精度曲线; 「b」不同数目最佳返回图像精度曲线(不确定); 「c」具有 48 位哈希编码的精度-召回曲线。

 

表1:第一组实验设置下不同方法的 MAP。 NUS-WIDE 数据集的 MAP 是根据返回的前 5,000 位邻近值计算的。DPSH * 表示重新运行 DPSH 作者提供的代码。 

 

表2:第二组实验设置下不同方法的 MAP 。 NUS-WIDE 数据集的 MAP 是根据返回的前 50,000 位邻近值计算的。 DPSH * 表示重新运行 DPSH 作者提供的代码。

 

表3:第一组实验设置下不同方法的 MAP 。NUS-WIDE 数据集的 MAP 是根据返回的前 5,000 位邻近值计算的。


更多精彩,请阅读原文: 



论文:Deep supervised discrete hashing

论文地址:https://arxiv.org/abs/1705.10999

 

【论文摘要】随着网络上图像和视频数据的快速发展,近几年图像及视频检索也被广泛的研究。得益于深度学习的发展,深度哈希方法在图像检索方面也取得了一定的成果。然而,之前的深度哈希方法还是存在一些限制「例如,没有充分利用语义信息」。在本文中,我们提出了一种深度离散哈希算法(discrete hashing algorithm ),该算法认为学习到的二值编码应该也可以用于分类。成对标签信息和分类信息在统一框架下用于学习哈希编码。我们将最后一层的输出直接限制为二进制编码,而这种做法在基于深度学习哈希算法中很少被研究。由于哈希编码的离散性质,我们使用交替优化方法来求解目标函数。实验结果表明,我们的方法在基准数据集上的表现要好过目前最好的哈希方法。


延伸阅读:一分钟了解NIPS 



NIPS全称为 Annual Conference and Workshop on Neural Information Processing Systems,于 1986 年在由加州理工学院和贝尔实验室组织的 Snowbird 神经网络计算年度闭门论坛上首次提出。会议固定在每年 12 月举行。今年是第 31 届,将于 12 月 4 日到 9 日在美国西岸加州南部的长滩市(Long Beach)举办。


计算机学科由于成果更新迅速,该领域更愿意通过会议优先发表成果,因此该类顶级会议大多比期刊更具权威性与影响力。NIPS 和 ICML 是机器学习领域最受认可的两大顶会,是中国计算机学会 CCF 推荐的 A 类会议及 Google 学术指标前五名。


本届 NIPS 共收到 3240 篇论文投稿,创历年新高,其中 678 篇被选为大会论文,录用比例 20.9%。其中有 40 篇口头报告(Oral)和 112 篇亮点报告(Spotlight)。


登录查看更多
8

相关内容

【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
60+阅读 · 2020年6月25日
专知会员服务
49+阅读 · 2020年6月14日
专知会员服务
108+阅读 · 2020年5月21日
从手工提取特征到深度学习的三种图像检索方法
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
无问西东,只问哈希
线性资本
3+阅读 · 2018年1月18日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Arxiv
5+阅读 · 2018年5月21日
Arxiv
9+阅读 · 2018年5月7日
Arxiv
5+阅读 · 2018年3月28日
VIP会员
Top
微信扫码咨询专知VIP会员