Embedding representation learning via neural networks is at the core foundation of modern similarity based search. While much effort has been put in developing algorithms for learning binary hamming code representations for search efficiency, this still requires a linear scan of the entire dataset per each query and trades off the search accuracy through binarization. To this end, we consider the problem of directly learning a quantizable embedding representation and the sparse binary hash code end-to-end which can be used to construct an efficient hash table not only providing significant search reduction in the number of data but also achieving the state of the art search accuracy outperforming previous state of the art deep metric learning methods. We also show that finding the optimal sparse binary hash code in a mini-batch can be computed exactly in polynomial time by solving a minimum cost flow problem. Our results on Cifar-100 and on ImageNet datasets show the state of the art search accuracy in precision@k and NMI metrics while providing up to 98X and 478X search speedup respectively over exhaustive linear search. The source code is available at https://github.com/maestrojeong/Deep-Hash-Table-ICML18


翻译:通过神经网络进行嵌入式代号学习是现代类似搜索的核心基础。虽然在开发算法以学习二进制模拟代号表达式以提高搜索效率方面已经付出了很大努力,但还需要对每个查询的全数据集进行线性扫描,并通过二进制转换来交换搜索精度。为此,我们认为直接学习一个可量化嵌入代号以及稀疏二进式散散散散散散散散散散散散散分代码端对端到端的问题,可以用来构建一个高效的散列表,不仅能显著减少数据的搜索数量,而且能达到艺术搜索精确度,超过艺术深度计量学习方法以前的状态。我们还表明,通过解决最低成本流问题,可以在多盘时间精确地计算出每个查询的最佳稀少的二进制代号。我们在Cifar-100和图像网络数据集上的结果显示精度@k和NMI 度度的艺术搜索精度,同时提供98X和478X搜索速度,分别超过彻底的线性搜索。源码可在 https://glip-ML18/masmagromagrom。

4
下载
关闭预览

相关内容

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
小样本学习(Few-shot Learning)综述
PaperWeekly
120+阅读 · 2019年4月1日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Reinforcement Learning: An Introduction 2018第二版 500页
CreateAMind
11+阅读 · 2018年4月27日
Representation Learning on Network 网络表示学习
全球人工智能
10+阅读 · 2017年10月19日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Arxiv
13+阅读 · 2020年4月12日
Arxiv
35+阅读 · 2020年1月2日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
VIP会员
Top
微信扫码咨询专知VIP会员