基于素描图的细粒度图像检索【附PPT与视频资料】

2018 年 12 月 27 日 人工智能前沿讲习班

关注文章公众号

回复"庞璐"获取PPT与视频

视频资料可点击下方阅读原文在线观看


Introduction


近年来,随着监控摄像头的普及与应用,监控摄像头系统在打击罪犯和刑侦安全方面起到了至关重要的作用。利用监控系统查找犯罪嫌疑人,从而侦破案件已经成为公安机关的重要破案手段。这一重要应用使得行人重识别问题得到广泛关注。行人重识别是指给定行人在某一监控摄像头下的图片,利用计算机视觉算法在其余监控摄像头下识别出这一特定行人。

然而,在刑侦和很多犯罪场景下,通常监控摄像头并不能拍摄到嫌疑人或者罪犯的照片。在此情况下,通过与目击证人和受害者的多次交流,法医艺术家最终绘出犯罪嫌疑人或罪犯的素描图。之后,公安机关使用这张素描图在监控摄像头下识别和检索嫌疑人或罪犯。这个问题被定义为行人素描重识别问题,是指给定行人的素描图,利用计算机视觉算法在监控摄像头下识别出这一特定行人。


作者简介


庞璐,北京大学信息工程学院在读硕士,本科毕业于北京大学信息科学技术学院,目前主要研究方向是基于素描图的图像检索,同时研究兴趣也在于强化学习,迁移学习和计算机视觉。目前已在CVPR和ACM Multimedia发表过文章。



Related work


基于素描图的细粒度图像检索问题是一个跨域匹配问题,指的是给定一个手画的素描图(例如一只鞋),在这一类物体的图片库中检索出这个物体。Yi Li[1]首先提出基于细粒度的图像检索问题,使用DPM(Deformable Part Models)编码提取的手工特征,之后利用图匹配的方式匹配素描图和图片。2016年,Qian Yu[4]第一次利用深度学习的模型解决基于素描图的细粒度图像检索问题,提出三个分支的网络结构,用triplet损失函数进行优化;为了解决数据集过小的问题,提出两种数据增强的方式:比划去除和图像变形;同时提出了三阶段的训练方式来避免数据集过小产生的过拟合的问题。Zhun Zhong[2]使用生成网络来加强提取出的特征的判别性。为了解决素描图和图片的不对齐问题,Wei Li[3]在三分支网络结构的基础上引入三个模块:注意力机制模块,短接融合模块和HOLEF(Higher-Order Learnable Energy Function)损失函数。然而,这些方法的共同点在于:为了消除素描域和图片域的差距,需要对图片进行预处理:提取边缘图,将边缘图和素描图输入到深度网络结构中提取特征并匹配。总之,这些算法并没有从本质上解决跨域匹配的问题。


Method


为了解决不能学到域不变特征的问题,本文运用跨域对抗特征学习模型,通过结合个体特征学习和对抗特征学习的优势,过滤掉底层干扰信息,保留高层域不变特征。

本文提出联合特征学习架构同时学习个体可区分特征和域不变特征。素描图和行人照片分别通过行人素描图特征生成器和行人照片特征生成器进行特征提取,提取到的特征分别通过行人ID确认子网络和域判别器子网络。其中行人ID确认子网络代表个体特征学习任务,可以是行人ID分类和确认任务,用于学习个体可区分的特征。通过引入域判别器来建立对抗特征学习任务,域判别器的优化目标是尽可能判别输入的特征是来自于素描图还是行人图片,特征生成器的优化目标是尽可能生成域不变的特征,因此两个特征生成器和域判别器的优化目标是对抗的。实际上,交替优化特征生成器和域判别器。


Dataset


实验数据集使用PKU Sketch Re-ID数据集。这个数据集一共有200个人:每个人有1张素描图,两张照片,分别来自不同的摄像头。

数据集下载地址:

https://www.pkuml.org/resources/pkusketchreid-dataset.html


Take-home-message




Reference


[1]Yi Li, Timothy M Hospedales, Yi-Zhe Song, and Shaogang Gong. 2014. Fine-grained sketch-based image retrieval by matching deformable part models. (2014).

[2]Kaiyue Pang, Yi-Zhe Song, Tao Xiang, and Timothy Hospedales. 2017. Cross-domain generative learning for fine-grained sketch-based image retrieval. BMVC.

[3]Jifei Song, Yu Qian, Yi-Zhe Song, Tao Xiang, and Timothy Hospedales. 2017. Deep spatial-semantic attention for fine-grained sketch-based image retrieval. In ICCV.

[4]Qian Yu, Feng Liu, Yi-Zhe Song, Tao Xiang, Timothy M Hospedales, and Chen Change Loy. 2016. Sketch me that shoe. In Computer Vision and Pattern Recognition (CVPR), 2016 IEEE Conference on. IEEE, 799–807.

[5]Lu Pang, Yaowei Wang, Yi-Zhe Song, Tiejun Huang, Yonghong Tian, Cross domain adversarial feature learning for sketch re-identification, In ACM Multimedia 2018.



SFFAI讲者招募

为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。

SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。

SFFAI还将构建人工智能领域的知识树(AI Knowledge Tree),通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献。

这项意义非凡的社区工作正在稳步向前,衷心期待和感谢您的支持与奉献!


有意加入者请与我们联系:wangxl@mustedu.cn


历史文章推荐:

重磅 |《模式识别与机器学习》资源大礼包

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

SFFAI分享 | 曹杰:Rotating is Believing

SFFAI分享 | 黄怀波 :自省变分自编码器理论及其在图像生成上的应用

AI综述专栏 | 深度神经网络加速与压缩

SFFAI分享 | 田正坤 :Seq2Seq模型在语音识别中的应用

SFFAI 分享 | 王克欣 : 详解记忆增强神经网络

SFFAI报告 | 常建龙 :深度卷积网络中的卷积算子研究进展

SFFAI 分享 | 李宏扬 :二阶信息在图像分类中的应用


录播视频,请点击下方
阅读原文
观看
↓↓
登录查看更多
12

相关内容

【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
【ICLR2020】图神经网络与图像处理,微分方程,27页ppt
专知会员服务
47+阅读 · 2020年6月6日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【课程推荐】人工智能导论:Introduction to Articial Intelligence
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
基于人体骨架的行为识别【附PPT与视频资料】
人工智能前沿讲习班
31+阅读 · 2019年1月15日
基于深度学习的通用物体检测算法对比探索【附PPT与视频资料】
人工智能前沿讲习班
5+阅读 · 2019年1月11日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
自注意力机制在计算机视觉中的应用【附PPT与视频资料】
人工智能前沿讲习班
17+阅读 · 2018年12月20日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
一文读懂神经网络(附PPT、视频)
数据派THU
17+阅读 · 2018年3月25日
独家 | 基于深度学习的行人重识别研究综述
AI科技评论
11+阅读 · 2017年12月20日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
3+阅读 · 2018年1月10日
VIP会员
相关VIP内容
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
56+阅读 · 2020年6月24日
【ICLR2020】图神经网络与图像处理,微分方程,27页ppt
专知会员服务
47+阅读 · 2020年6月6日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【课程推荐】人工智能导论:Introduction to Articial Intelligence
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
相关资讯
SFFAI分享 | 连政:端到端语音合成【附PPT与视频资料】
人工智能前沿讲习班
14+阅读 · 2019年6月16日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
基于人体骨架的行为识别【附PPT与视频资料】
人工智能前沿讲习班
31+阅读 · 2019年1月15日
基于深度学习的通用物体检测算法对比探索【附PPT与视频资料】
人工智能前沿讲习班
5+阅读 · 2019年1月11日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
自注意力机制在计算机视觉中的应用【附PPT与视频资料】
人工智能前沿讲习班
17+阅读 · 2018年12月20日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
一文读懂神经网络(附PPT、视频)
数据派THU
17+阅读 · 2018年3月25日
独家 | 基于深度学习的行人重识别研究综述
AI科技评论
11+阅读 · 2017年12月20日
Top
微信扫码咨询专知VIP会员