Generative semantic hashing is a promising technique for large-scale information retrieval thanks to its fast retrieval speed and small memory footprint. For the tractability of training, existing generative-hashing methods mostly assume a factorized form for the posterior distribution, enforcing independence among the bits of hash codes. From the perspectives of both model representation and code space size, independence is always not the best assumption. In this paper, to introduce correlations among the bits of hash codes, we propose to employ the distribution of Boltzmann machine as the variational posterior. To address the intractability issue of training, we first develop an approximate method to reparameterize the distribution of a Boltzmann machine by augmenting it as a hierarchical concatenation of a Gaussian-like distribution and a Bernoulli distribution. Based on that, an asymptotically-exact lower bound is further derived for the evidence lower bound (ELBO). With these novel techniques, the entire model can be optimized efficiently. Extensive experimental results demonstrate that by effectively modeling correlations among different bits within a hash code, our model can achieve significant performance gains.


翻译:生成语义散列是一个大比例信息检索的很有希望的技术, 因为它的检索速度很快,记忆足迹很小。 对于培训的可移动性, 现有的基因显示方法大多以后部分布为因子化形式, 强制在散列代码中保持独立。 从模型表达和代码空间大小的角度来看, 独立性总是不是最佳的假设。 在本文中, 为了引入散列代码各部分的关联性, 我们提议使用Boltzmann机器作为变式后视镜的分布方式。 为了解决培训的可选性问题, 我们首先开发了一种大致方法, 通过将波尔兹曼机器的分布作为高斯类分布和伯尔努利分布的分级组合来进行重新量化。 基于这一点, 一个非现性、 异性、 更低的界限是进一步推导出的证据约束性( ELBOO ) 。 有了这些新技术, 整个模型可以被高效地优化。 为了解决培训的易移动性问题, 我们首先开发了一种大致的实验结果, 通过将波尔茨曼机器的分布作为不同部分之间具有显著的代码, 我们的模型能够取得显著的成绩。

0
下载
关闭预览

相关内容

【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
29+阅读 · 2019年10月18日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
5+阅读 · 2018年5月28日
Arxiv
5+阅读 · 2018年5月21日
Arxiv
11+阅读 · 2018年3月23日
Arxiv
5+阅读 · 2018年3月6日
Arxiv
6+阅读 · 2018年2月26日
VIP会员
相关论文
Arxiv
5+阅读 · 2018年5月28日
Arxiv
5+阅读 · 2018年5月21日
Arxiv
11+阅读 · 2018年3月23日
Arxiv
5+阅读 · 2018年3月6日
Arxiv
6+阅读 · 2018年2月26日
Top
微信扫码咨询专知VIP会员