学习二值编码只为高效的时尚套装推荐

2020 年 11 月 4 日 机器学习与推荐算法
嘿,记得给“机器学习与推荐算法”添加星标

题目: Learning Binary Code for Personalized Fashion Recommendation

会议: CVPR2019

论文: https://paperswithcode.com/paper/learning-binary-code-for-personalized-fashion

论文代码: https://github.com/lzcn/Fashion-Hash-Net

1 Motivation

随着以时尚为中心的社交网络和在线购物的兴起,数以百万计的用户共享并发布与时尚相关的日常活动。社区中的用户每天创造大量的时尚套装,因此从这些海量数据集中挖掘理想的服装非常具有挑战性,但对于这些在线时尚社区的发展至关重要。与此同时,每种服装类别中的衣服数量均随项目数量呈指数增长。存储和检索效率对于如今的时尚推荐系统也是至关重要的。基于这两项挑战:推荐性能和推荐效率,作者提出了一个集效率和性能为一体的个性化时尚推荐模型。

2 Model

下图为论文所提模型的整体框架图,其中有三个重要模块:1)用来提取特征的特征网络(Feature network)2)学习哈希码的类型依赖的哈希模块(Hashing modules)3)预测偏好分数的打分模块(The matching block)。

模型的输入为用户的one-hot编码和图片特征,图片特征通过卷积神经网络来提取;哈希模块是两层全连层后加了一个符号函数;用户的编码器是一层全连层。

2.1 Matching block

由于推荐场景为时尚套装推荐,因此进行推荐时,不仅需要考虑一个时尚套装内物品的兼容性(比如推荐时,在一个套装内包含两件上衣就很不合理)同时还要考虑用户对物品的偏好。因此,基于这一直觉,用户 对套装 预测分数为:其中:第一项为用来建模用户对物品的偏好程度第二项为建模物品之间的兼容性。 为对角矩阵, 分别为物品和用户的哈希码, 为用于归一化的常数,参数 用来平衡两项的权重。

2.2 Learning to Hash

由于离散限制,直接优化哈希码较为困难,因此,我们将上述公式改写为其中:通过控制 的大小,当优化结束时, 逐渐收敛于二进制码

2.3 Objective Function

除了图片之外,提供语义信息的文本描述对于兼容性建模也是非常有用的,作者使用和图片同样的方式将文本信息转换为二进制码,并得到预测分数。文中用 分别表示来自不同模块的二进制码,其中 表示视觉信息, 表示文本信息。因此,模型最终预测用户 对套装 的偏好分数为:作者采用BPR损失来学习模型参数:其中同时,作者认为对于同样的物品,其视觉特征和文本特征应该保持一致,所以作者在整体的模型上添加了如下限制:其中 为同一个物品的视觉和文本特征, 为不同物品的视觉和文本特征。因此,模型的损失函数为:

3 Experiments

3.1 Datasets

由于现有的数据集要么太小,要么缺少用户信息,都不适用于个性化时尚推荐场景,因此作者从Polyvore网站上收集了一个新数据集,数据集信息如表1所示:对于负样本的选取:1)物品的随机组合2)其他用户正样本的随机采样

3.2 Experimental Results

通过实验对比发现,论文提出的方法相比其他方法在AUC上有6.6%-12.1%的提升,NDCG有了19.56%-26.56%的提升。为了可视化排序质量,作者给出了三个用户Top10的推荐套装,发现论文所提方法优于现有方法。为了验证用户对于物品的偏好和物品之间的兼容性这两组件是否对于模型性能提升有帮助,作者进行了退化实验,如表6所示。实验发现所有的退化模型相比论文提出的完整的模型性能都要差,说明这两组件缺一不可。

(更多细节可参考原文)

小结

在这项工作中,作者提出了如何利用哈希技术来进行高效的个性化时尚套装的推荐。通过大量的实验,展示了论文所提模型的性能,即使是利用了简单的框架并且用户和物品的特征均为哈希码。

推荐阅读

RecSys2020虚拟参会体验总结
面向科研的推荐系统Benchmark诞生!

万字长文带你了解推荐系统全貌

喜欢的话点个在看吧👇
登录查看更多
0

相关内容

【WWW2021】基于双侧深度上下文调制的社会化推荐系统
专知会员服务
27+阅读 · 2021年1月28日
深度学习图像检索(CBIR): 十年之大综述
专知会员服务
46+阅读 · 2020年12月5日
【KDD2020】 解决基于图神经网络的会话推荐中的信息损失
专知会员服务
31+阅读 · 2020年10月29日
【CIKM2020】学习个性化网络搜索会话
专知会员服务
14+阅读 · 2020年9月20日
专知会员服务
22+阅读 · 2020年9月8日
【SIGIR2020】用于冷启动推荐的内容感知神经哈希
专知会员服务
22+阅读 · 2020年6月2日
【SIGIR2020】LightGCN: 简化和增强图卷积网络推荐
专知会员服务
72+阅读 · 2020年6月1日
推荐召回算法之深度召回模型串讲
AINLP
22+阅读 · 2019年6月14日
数据挖掘的前沿论文,看我们推荐的这7篇
人工智能前沿讲习班
7+阅读 · 2019年3月11日
基于深度交叉特征的推荐系统
微信AI
9+阅读 · 2019年2月1日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
【推荐】xLearn:一款专门针对大规模稀疏数据的机器学习库
机器学习研究会
3+阅读 · 2017年11月25日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
Arxiv
5+阅读 · 2020年3月16日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Arxiv
5+阅读 · 2018年3月28日
Arxiv
9+阅读 · 2018年1月30日
VIP会员
相关VIP内容
【WWW2021】基于双侧深度上下文调制的社会化推荐系统
专知会员服务
27+阅读 · 2021年1月28日
深度学习图像检索(CBIR): 十年之大综述
专知会员服务
46+阅读 · 2020年12月5日
【KDD2020】 解决基于图神经网络的会话推荐中的信息损失
专知会员服务
31+阅读 · 2020年10月29日
【CIKM2020】学习个性化网络搜索会话
专知会员服务
14+阅读 · 2020年9月20日
专知会员服务
22+阅读 · 2020年9月8日
【SIGIR2020】用于冷启动推荐的内容感知神经哈希
专知会员服务
22+阅读 · 2020年6月2日
【SIGIR2020】LightGCN: 简化和增强图卷积网络推荐
专知会员服务
72+阅读 · 2020年6月1日
相关资讯
推荐召回算法之深度召回模型串讲
AINLP
22+阅读 · 2019年6月14日
数据挖掘的前沿论文,看我们推荐的这7篇
人工智能前沿讲习班
7+阅读 · 2019年3月11日
基于深度交叉特征的推荐系统
微信AI
9+阅读 · 2019年2月1日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
【推荐】xLearn:一款专门针对大规模稀疏数据的机器学习库
机器学习研究会
3+阅读 · 2017年11月25日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
Top
微信扫码咨询专知VIP会员