WWW 2020 | 用于图像检索的等距离等分布三元组损失函数

2020 年 4 月 14 日 AI科技评论

作者 | 张伟

编辑 | 丛末

本文对WWW2020 论文《Metric Learning with Equidistant and Equidistributed Triplet-based Loss for Product Image Search》(用于图像检索的等距离等分布三元组损失函数)进行解读,作者来自蚂蚁金服。


1


研究背景
图像检索由于类内差异大、类间相似性高,非常具有挑战性。深度度量学习在该任务上取得了一定的效果。然而,最为经典的深度度量学习损失函数——三元组损失,存在一定的问题。
首先,三元组损失约束了匹配对和不匹配对间的距离差异至少为一个固定间隔值,由于没有直接约束匹配对或者不匹配对的距离,使得局部范围内三元组满足间隔约束时不能保证全局范围内也满足。其次,改进的三元组损失进一步约束所有匹配对距离小于某个固定值以及所有不匹配对的距离大于某个固定值,这种固定值约束没有考虑到图像不同类别的独特性,容易造成特征空间扭曲。因此,需要通过相对距离约束去自适应地调整匹配对的距离和不匹配对的距离。

2


研究动机和方法实现
为了在全局范围内进一步拉近匹配对的距离和推远不匹配对的距离,在三元组损失的间隔约束基础上,我们针对匹配对和不匹配对分别进行了相对距离约束。
拉近匹配对:等距离约束        
当两个样本足够近(重合到一点)时,到任意一个其他样本的距离应该相等。反之,如果有多个样本到某两个样本的距离相等时,那么这两个样本应该足够近。基于这个直观的几何现象,我们提出了等距离约束。通过约束三元组中的两组不匹配对的距离相等,使得三元组中的匹配对足够近。满足等距离约束时,存在一种朴素的最优解,即所有样本都足够近。为了避免这种情况,等距离约束依赖间隔约束,间隔约束可以拉开不匹配对和匹配对间的距离。这两个约束的作用使匹配对足够近(理想情况下重合到一点),并且不匹配对和匹配对的距离间存在间隔值,因此能够在全局范围内通过距离差异区分开匹配对和不匹配对。
等距离约束:

间隔约束:

一种等距离约束的优化情形如图1所示,三元组{}为了满足等距离约束,匹配对和朝着红色箭头方向移动,三元组{}为了满足等距离约束,匹配对和朝着绿色箭头方向移动,最终匹配对和朝着橘色箭头方向移动变得更近。

图1:等距离约束优化
推远不匹配对:等分布约束
由于三元组损失没有对样本的分布进行约束,可能导致所有样本的特征分布到某个特征子空间,使得不匹配对的距离没有被足够拉远。为了拉开不匹配对的距离,我们期望不同类别在特征空间中尽可能均匀分布。在数学上,均匀分布等价于最大化最小距离,所以我们通过最大化类间的最小距离并且约束最小距离相等,来使得不同类别尽可能均匀分布到整个特征空间,从而增大不匹配对的距离。
等分布约束:



最终,等距离约束、等分布约束和间隔约束构成了等距离等分布三元组损失函数(EET)。

EET使得匹配对的距离更大,不匹配对的距离更小。

图2:EET效果

3


实验结果
数据集使用Deep Fashion In-ShopClothes Retrieval (DFISCR)和Stanford Online Products(SOP)。

文章还对不同约束下的结果进行了特征可视化和检索结果可视化。可以看出EET比MC(Margin Constraint)约束下学到的特征类内更集中,类间分布更均匀。

除商品检索外,EET在行人再识别、细粒度检索等多个检索数据集上的精度均得到了提升,对比结果如下。



4


结束语
本文提出的EET方法通过等距离约束进一步拉近匹配对的距离,等分布约束进一步推远不匹配对的距离。实验结果表明方法可以用在多个检索任务上。如何挑选更有信息量的三元组来优化模型参数以及学习更紧凑的特征表示是接下来需要思考的方向。

 

点击“阅读原文” ,直达直播现场

登录查看更多
6

相关内容

三元组是指形如((x,y),z)的集合(这就是说,三元组是这样的偶,其第一个射影亦是一个偶),常简记为(x,y,z)。三元组是计算机专业的一门公共基础课程——数据结构里的概念。主要是用来存储稀疏矩阵的一种压缩方式,也叫三元组表。假设以顺序存储结构来表示三元组表(triple table),则得到稀疏矩阵的一种压缩存储方式,即三元组顺序表,简称三元组表。
【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing
专知会员服务
65+阅读 · 2020年7月12日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
论文浅尝 | 知识图谱三元组置信度的度量
开放知识图谱
24+阅读 · 2019年5月16日
再谈人脸识别损失函数综述
人工智能前沿讲习班
14+阅读 · 2019年5月7日
人脸识别损失函数综述(附开源实现)
极市平台
29+阅读 · 2019年3月12日
机器学习的5种距离度量方法
七月在线实验室
9+阅读 · 2018年5月18日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
论文 | 用于密集对象检测的 Focal Loss 函数
七月在线实验室
9+阅读 · 2018年1月4日
文本分析 | 常用距离/相似度 一览
数说工作室
26+阅读 · 2017年10月12日
Arxiv
4+阅读 · 2019年4月3日
Arxiv
5+阅读 · 2018年3月28日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关VIP内容
【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing
专知会员服务
65+阅读 · 2020年7月12日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
相关资讯
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
论文浅尝 | 知识图谱三元组置信度的度量
开放知识图谱
24+阅读 · 2019年5月16日
再谈人脸识别损失函数综述
人工智能前沿讲习班
14+阅读 · 2019年5月7日
人脸识别损失函数综述(附开源实现)
极市平台
29+阅读 · 2019年3月12日
机器学习的5种距离度量方法
七月在线实验室
9+阅读 · 2018年5月18日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
论文 | 用于密集对象检测的 Focal Loss 函数
七月在线实验室
9+阅读 · 2018年1月4日
文本分析 | 常用距离/相似度 一览
数说工作室
26+阅读 · 2017年10月12日
Top
微信扫码咨询专知VIP会员