【优博微展2017】陈志祥:面向快速视觉检索的非线性哈希学习

2017 年 8 月 16 日 清华大学研究生教育 陈志祥


陈志祥:2017年清华大学优秀博士学位论文一等奖获得者


面向快速视觉检索的非线性哈希学习


NONLINEAR HASHING LEARNING FOR QUICK VISUAL RETRIEVAL


作    者:陈志祥

指导教师:周杰教授

培养院系:自动化系

学    科:控制科学与工程

读博感言:情与感交织的博士生涯是人生的一趟旅途。


研究背景/选题意义/研究价值


随着信息技术的迅猛发展,图像和视频的数据量呈现出爆炸性增长,因而对高效的信息检索提出了很高要求。近年来,基于哈希学习的数据检索引起了学术界和工业界的广泛关注。其基本思想是通过哈希函数将高维的数据点编码成紧致的二值码,由于紧致的二值码具有存储和计算的高效性以及维度不敏感的优势,在大规模数据环境下具有广阔的应用前景。


主要研究内容


图1 基于哈希的近邻检索系统框图


当前使用哈希方法实现视觉检索(如图1所示)的主要挑战在于二值码不够紧致、视觉语义与结构信息未充分利用等,导致其检索效率还很不理想。论文主要开展以下工作:对于哈希学习问题,针对从特征空间到汉明空间的映射以及二值码的离散优化,提出了用于近似图像检索的非线性离散哈希学习算法;对于多视图数据的哈希学习,针对数据对象不同视图特征之间的协同学习问题,提出了多哈希映射协同学习算法;对于视频数据的哈希学习,针对视频数据的场景结构特性,提出了用于近似视频检索的结构化视频哈希算法。


主要创新点


1、非线性离散哈希:针对哈希映射引入非线性变换网络来保持数据结构特性,针对二值码进行离散优化求解以获得紧致且区分力强的二值码,提高了近邻检索的性能;


2、多视图协同哈希:针对不同视图特征的协同学习问题,提出了多个非线性哈希映射协同学习算法,并通过视图间的协同约束和类标信息指导哈希函数构建,提高了近邻检索的精度;


3、结构化视频哈希:针对视频数据提出在哈希学习时同时保持视频之间的非线性关系和视频结构信息,并使用集合到集合的距离来度量视频相似性,更加有效地进行视频数据的近邻检索。


代表性学术发表


1、ZhixiangChen, Jiwen Lu, Jianjiang Feng and JieZhou. Nonlinear Discrete Hashing. IEEE Transactions on Multimedia, 2017, 19(1):123-135.


2、ZhixiangChen, Jiwen Lu, Jianjiang Feng and JieZhou. Nonlinear Structural Hashing for Scalable Video Search. 2017, In press.


3、Zhixiang Chen and JieZhou. Collaborative MultiviewHashing. 2017, In press.


4、Zhixiang Chen, Jiwen Lu, Jianjiang Feng and Jie Zhou. Nonlinear Sparse Hashing. 2017, In press.


编辑:清华大学研究生院  周明坤  严颖巧

登录查看更多
6

相关内容

专知会员服务
49+阅读 · 2020年6月14日
【天津大学】知识图谱划分算法研究综述
专知会员服务
104+阅读 · 2020年4月27日
【天津大学】风格线条画生成技术综述
专知会员服务
31+阅读 · 2020年4月26日
专知会员服务
84+阅读 · 2019年12月13日
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
38+阅读 · 2019年12月5日
【泡泡图灵智库】协同视觉-惯性SLAM
泡泡机器人SLAM
28+阅读 · 2019年9月6日
【优博微展2018】刘昊:基于深度神经网络的人脸关键点检测
清华大学研究生教育
32+阅读 · 2018年12月1日
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
无问西东,只问哈希
线性资本
3+阅读 · 2018年1月18日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
Arxiv
7+阅读 · 2020年3月1日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Structure Aware SLAM using Quadrics and Planes
Arxiv
4+阅读 · 2018年8月13日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
相关资讯
【泡泡图灵智库】协同视觉-惯性SLAM
泡泡机器人SLAM
28+阅读 · 2019年9月6日
【优博微展2018】刘昊:基于深度神经网络的人脸关键点检测
清华大学研究生教育
32+阅读 · 2018年12月1日
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
无问西东,只问哈希
线性资本
3+阅读 · 2018年1月18日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
Top
微信扫码咨询专知VIP会员