大规模检索高效训练难?在线哈希有新方法!

2020 年 5 月 20 日 中国图象图形学报

点击中国图象图形学报→主页右上角菜单栏→设为星标


主题词

二值化编码、在线哈希、图像检索

图像分类、哈达玛矩阵




图1 同一类图片的哈希编码距离要小于不同类别的编码距离


图像的特征表示是实现图像相似性检索的决定性一环,不仅是计算机视觉领域的基础研究难题,也在人工智能潮流下的信息社会中有着广泛的应用场景,比如交通系统中车辆的定位、网购中的相似性商品查找、公安系统中的嫌疑人搜索等。

然而,随着大数据、5G时代的到来,十几亿甚至上百亿的流数据为相似图片/视频等的检索学习带来了巨大挑战。如图1所示,图像哈希编码使用0-1串来表示图像特征,能够高效实现相似性检索的同时减少图片特征的存储开销,因此图像哈希编码吸引了众多研究者的目光。

厦门大学纪荣嵘课题组2020年5月于人工智能顶刊 《International Journal of Computer Vision》(IJCV)在线发表最新论文,提出了一套解决大规模流数据问题的在线哈希编码方案,以更少的训练时间,在不同的数据集下获得10%~30%的精度增长。


关注我们
一起努力




论文信息


题目:Hadamard Matrix Guided Online Hashing
作者:Mingbao Lin, Rongrong Ji, Hong Liu, Xiaoshuai Sun, Shen Chen, Qi Tian
发表期刊International Journal of Computer Vision
DOI:10.1007/s11263-020-01332-z
引用格式Lin, M., Ji, R., Liu, H. et al. Hadamard Matrix Guided Online Hashing. Int J Comput Vis(2020).
全文链接
https://link.springer.com/article/10.1007/s11263-020-01332-z
相关代码已开源:
https://github.com/lmbxmu


研究背景



图2 网络数据流源源不断地产生使得数据库急剧增长,在线哈希学习成为减少哈希编码复杂度不可或缺的技术途径


近年来人工智能领域中的哈希编码技术是实现相似性检索的有效途径,然而以微信为代表的社交平台,每天都会产生大规模的流数据网络图片,互联网的兴起为相似图片/视频等的检索学习带来了巨大挑战。大量的数据集为训练一套成熟的检索系统带来了大量的时间和人力成本投入。

本文主要探索在大规模流数据环境中进行在线哈希编码的高效学习,减少资源开销的同时保持检索系统的稳定性。




研究方法


本研究发现,哈希编码的检索问题在训练阶段可以转化为图像/视频等的分类问题,并提出了一套解决大规模流数据问题的在线哈希编码方案,不同于传统的方法,该方案进行哈希编码的时候仅仅只需要利用当前阶段的流数据,因此学习效率在每一阶段都是恒等的。我们把具有正交性质的哈达玛矩阵作为同一类流数据的目标编码,目标编码进一步作为感知机的虚拟类别来学习分类器。为此,如图3所示,我们的学习过程分为:

(a) 训练集以流数据的形式被接收。
(b)根据流数据点的类别分配哈达玛某一列作为目标学习编码。
(c) 将目标编码作为虚拟类别,学习分类器进行在线类别预测。

由于目标编码是已知的,我们不需要去设计很复杂的约束性条件。因此,相比于目前已有的最佳方法,所提方案需要更少的训练时间。


图3 本文在线哈希编码学习流程图



研究结果


通过多个公开数据源,包括CIFAR-10, Places205, MINST和NUS-WIDE测试表明,所提的在线哈希编码学习方案,相比于已有方法,获得10%~30%的mAP增长(如图4-7所示)。该技术可应用于大规模城市视觉目标布控、特定网络产品查找等。


图4 CIFAR-10下的mAP性能对比


图5 Places205下的mAP性能对比


图6 MNIST下的mAP性能对比


图7 NUS-WIDE下的mAP性能对比



研究结论


在线学习一套成熟稳定的哈希编码检索系统是信息大爆发背景下可靠技术途径,可以有效减少时间和人力开销成本。在目标哈希编码给定的情况下,本文表明,检索问题转化为图片分类能够极大简化检索系统学习的复杂性,同时获得检索性能的提升。




更多信息    详见论文




作者简介

第一作者:林明宝,博士生,厦门大学信息学院人工智能系,研究领域:哈希二值化编码、神经网络压缩与加速。


通讯作者:纪荣嵘,教授,博士生导师,厦门大学信息学院人工智能系,研究领域: 计算机视觉、模式识别




团队介绍



纪荣嵘课题组(厦门大学媒体分析与计算实验室)主要研究方向为计算机视觉、模式识别。研究侧重点是开发大数据驱动的计算机智能处理系统,进行视觉场景理解、视觉行为分析、多媒体内容理解、及视觉内容检索。团队70余篇科研论文发表于国际期刊PAMI、IJCV、TIP和国际会议CVPR、NeurIPS、ICCV、IJCAI、AAAI、ACM Multimedia上。


主页:
http://mac.xmu.edu.cn/index.php



团队代表性成果

Yiyi Zhou, Rongrong Ji*, Xiaoshuai Sun, Jingsong Su, Deyu Meng, Yue Gao, Chunhua Shen. 2019. Plenty is Plague: Fine-Grained Learning for Visual Question Answering. IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)


Rongrong Ji, Ke Li*, Yan Wang, Feng Guo, Xiaowei Guo, Yongjian Wu, Feiyue Huang, and Jiebo Luo. 2019. Semi-Supervised Adversarial Monocular Depth Estimation. IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)


Shaohui Lin, Rongrong Ji*, Chao Chen, Dacheng Tao, Jiebo Luo. 2018. Holistic CNN Compression via Low-rank Decomposition with Knowledge Transfer. IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)


Hong Liu, Rongrong Ji*, Jingdong Wang, Chunhua Shen. 2018. Ordinal Constraint Binary Coding for Approximate Nearest Neighbor Search. IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)


Mingbao Lin, Rongrong Ji*, Yan Wang, Yichen Zhang, Baochang Zhang, Yonghong Tian, Shao Ling. 2020. HRank: Filter Pruning using High-Rank Feature Map. IEEE Conference on Computer Vision and Pattern Recognition (CVPR, Oral )


Mingbao Lin, Rongrong Ji*, Shen Chen, Xiaoshuai Sun, Chia-Wen Lin. 2020.Similarity-Preserving Linkage Hashing for Online Image Retrieval. IEEE Transactions on Image Processing (T-IP)


Xiawu Zheng, Rongrong Ji*, Qiang Wang, Qixiang Ye, Zhenguo Li , Yonghong Tian , Qi Tian. 2020. Rethinking Performance Estimation in Neural Architecture Search. IEEE International Conference on Computer Vision and Pattern Recognition (CVPR)


更多论文:http://mac.xmu.edu.cn/papers.html





申明:本文发布的网站内容均不代表本号观点,本号旨在提供参考素材以便学习交流。



"图图Seminar" 直播回放


汪荣贵——机器学习基本知识体系与入门方法

知网在线教学服务平台:

http://k.cnki.net/CInfo/Index/5063


陈强——从Cell封面论文谈AI研究中的实验数据问题

知网在线教学服务平台:

http://k.cnki.net/CInfo/Index/4977





专家报告

专家报告 | 基于图深度学习的网络时空数据建模与预测

专家推荐 | 社交媒体多模态表示学习

好书推荐 | 算法分析与设计及案例教程

专家报告 | 优化抠图:背景去无踪,前景更出众

算法集锦 | 深度学习如何辅助医疗诊断?


论文写作

羡慕别人中了顶会?做到这些你也可以!

如何阅读一篇文献?

共享 | SAR图像船舶切片数据集

资源分享| 不知道如何获取最新的算法资讯?快来这里看一看

资源分享|热门IT资讯号推荐


往期目次

《中国图象图形学报》2020年第4期目次

《中国图象图形学报》2020年第3期目次



本文系《中国图象图形学报》独家稿件

内容仅供学习交流

版权属于原作者

欢迎大家关注转发!


编辑:狄   狄

指导:梧桐君

审校:夏薇薇

总编辑:肖   亮




声  明


欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。


齐心抗疫

与你同在

前沿 | 观点 | 资讯 | 独家

电话:010-58887030/7035/7418

网站:www.cjig.cn



在看点这里
登录查看更多
0

相关内容

基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
59+阅读 · 2020年6月25日
专知会员服务
49+阅读 · 2020年6月14日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
85+阅读 · 2020年5月23日
Github项目推荐 | DeepHash - 深度学习哈希开源库
AI研习社
26+阅读 · 2019年4月30日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
无问西东,只问哈希
线性资本
3+阅读 · 2018年1月18日
优化哈希策略
ImportNew
5+阅读 · 2018年1月17日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Arxiv
4+阅读 · 2019年1月14日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
3+阅读 · 2018年3月13日
Arxiv
5+阅读 · 2017年12月14日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
相关资讯
相关论文
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Arxiv
4+阅读 · 2019年1月14日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
3+阅读 · 2018年3月13日
Arxiv
5+阅读 · 2017年12月14日
Arxiv
4+阅读 · 2017年10月30日
Top
微信扫码咨询专知VIP会员