京东公布基于计算机视觉的电商推荐技术

2018 年 2 月 8 日 炼数成金订阅号

独立研发Telepath模型,落地京东推荐和信息流广告应用     

Telepath模型是一个基于视觉的仿生学推荐模型,它尝试模拟人类在购物决策中的大脑活动,从人类视觉的角度来理解用户,从而达到更佳的推荐效果。这一成果已经在京东推荐和信息流广告这两个最典型的场景落地,取得了显著的线上效果提升。值得一提的是,Telepath的工作完全由京东智能广告实验室独立完成,文章的7名作者都是在京东商业提升事业部工作多年的员工。


Telepath: Understanding Users from a Human Vision Perspective in Large-Scale Recommender System

Yu Wang, Jixing Xu, Aohan Wu, Mantian Li, Yang He, Jinghe Hu, Weipeng P. Yan

(王玉,徐吉兴,吴傲寒,李满天,赫阳,胡景贺,颜伟鹏)

论文链接:https://arxiv.org/abs/1709.00300


业界通用的推荐系统的核心包括检索(Retrieval)和排序(Ranking)两个模块,京东也不例外。在某个用户访问京东网站或APP时,检索模块负责为用户从数以亿计的商品中选择出数百个候选商品的集合,排序模块负责给这些候选商品打分,决定最终呈现给用户哪几个商品。本文主要关注排序阶段,但所述的技术对检索阶段来说是通用。


图1 推荐系统架构


Telapath心灵感应者-让心仪的商品找到顾客

京东拥有2.66亿的活跃用户,数以十亿计的商品库存单元(SKU),这样的业务规模世所罕见。如何把合适的商品推荐给每位用户,节约用户购物时间,增强用户购物体验,是横亘在京东技术人面前的较大难题。

原理   


人类的购物决策是非常复杂的大脑活动,研究[1][2]表明,人类擅长从复杂的图像中发现其感兴趣的事物。具体来说,这些事物产生的视觉信号会激活大脑皮层的神经元,通过这些激活的神经元,大脑的特定功能区域受到影响,形成人类的潜意识和表意识。另有研究[3][4]表明,人脑的潜意识和表意识共同影响人类的决策行为。此外,近年来深度学习在很多任务如围棋[5]和图像识别上[6]上已经达到了人类乃至超过人类的表现。


这些研究给我们带来了灵感来设计这样一个排序引擎,它能像人一样提取视觉信号,并从视觉角度来理解用户。参考大脑结构,我们把这个排序引擎分为三个组件:一个是视觉感知模块(Vision Extraction),它模拟人脑的视神经系统,提取商品的关键视觉信号并产生激活;另一个是兴趣理解模块(Interest Understanding),它模拟大脑皮层,根据视觉感知模块的激活神经元来理解用户的潜意识(决定用户的潜在兴趣)和表意识(决定用户的当前兴趣);此外,排序引擎还需要一个打分模块(Scoring),它模拟决策系统,计算商品和用户兴趣(包括潜在兴趣和当前兴趣)的匹配程度。


较好的推销员莫过于能猜透用户心思的那些人,我们对这个排序引擎给予同样的希望,为其命名为Telepath,即心灵感应者。


图2 Telepath的模型结构


Telepath的模型结构如图2所示,具体来说,视觉感知模块将用户浏览过的商品序列(图2中的1、2、3…N)通过深度卷积网络映射为激活信号,商品序列只提供商品图像和描述等信息,即用户在浏览推荐页面时能直接观看到的信息,卷积网络我们采用的是自己开发的Inception网络[7]的变种,网络规模更小,但速度更快。同时,视觉感知模块也把推荐候选集中的商品(图2中的C)也通过同一个卷积网络,形成候选商品的激活信号。


兴趣理解模块收集到用户浏览序列的激活信号后,分别通过DNN和RNN,生成两路向量。RNN常用于序列分析,我们用来模拟用户的直接兴趣,DNN一般用以计算更广泛的关系,我们用来模拟用户的间接兴趣。最终,直接兴趣向量和间接兴趣向量和候选商品激活拼接在一起,送往打分模块。


打分模块是个普通的DNN网络,我们用打分模块来拟合用户的点击/购买等行为。最终这些行为的影响通过loss回馈到整个Telepath模型中。


在图2右侧,我们还引入了类似Wide & Deep网络[8]的结构,以增强整个模型的表达能力。

可视化   



图3 视觉感知模块对不同商品激活信号的可视化


可视化对理解深度网络的行为至关重要,我们完成模型设计和训练后,考虑了两个维度来做可视化:1) 视觉感知模块对视觉信号的敏感程度;2) 用户兴趣理解模块对用户兴趣的区分度。我们使用t-SNE来将这两个模块的输出二维化。视觉感知模块的可视化结果如图3所示。


由图3可见,虽然整个Telepath网络并非用商品类目信息来训练,但仍然能够非常好地区分不同的商品。这符合我们的预期,也符合常理,因为卷积网络对相似的输入必然产生相似的输出。

图4 兴趣理解模块对不同用户激活信号的可视化

图4是用户兴趣理解模块的可视化结果,我们分析的是对手机、饼干、沙滩鞋感兴趣的三类用户。可以看出,对三类用户同时做可视化,兴趣理解模块的区分度并不显著,但如果只区分两类用户的话,兴趣理解模块可以做出不错的区分。这也符合常理,人在挑选多样物品的时候,也容易“挑花眼”,但如果只是从两件物品中选一件,一般来说更容易做出较好的选择。

实验


在Telepath之前,京东的全量基准所用的模型和Wide & Deep网络很接近,因此Telepath的离线实验主要是和Wide & Deep网络对比,见图5:


图5 Wide & Deep和Telepath对比(离线)


从图中可见,Telepath的Loss和AUC比起Wide & Deep网络都有一定改善。

表1 Telepath在某京东App推荐位的上线效果


表2 Telepath在某京东合作媒体广告的上线效果


作为一项以应用为目标的基础研究成果,Telepath在京东的诸多场景都有落地,在推荐、广告等实际业务中都发挥了作用。表1和表2分别展示了Telepath在一个京东App推荐位和一个京东广告合作媒体上线的效果,可以看出,在这两种场景下,点击率(CTR)和GMV都有显著的效果提升。


结语   

为了更好地服务京东的数亿级用户,Telepath还在不断进化,后续的成果也将在适当时机陆续公布。Telepath团队的几位成员习惯坐地铁下班,Telepath的思路就来自一次地铁上的讨论。这样的团队在京东还有很多。“无界零售”不仅在影响京东的每个用户,也在影响京东的每个技术人,“无界零售”对技术提出的更高要求,会迫使我们在基础研究上不断追赶学术界,在应用上不断将的AI技术落地到京东的各项产品中,为用户提供更好的服务。京东对核心技术的公布,也表达出了开放的姿态,“无界零售”必将对业界造成深远而深刻的影响。


参考文献

[1] Brewer, J. B.; Zhao, Z.; Desmond, J. E.; Glover, G. H.; and Ga- brieli, J. D. 1998. Making memories: brain activity that predicts how well visual experience will be remembered. Science 281(5380): 1185-1187.

[2] Çukur, T.; Nishimoto, S.; Huth, A. G.; and Gallant, J. L. 2013. Attention during natural vision warps semantic representation across the human brain. Nature neuroscience 16(6): 763-770.

[3] Galli, M.; and Gorn, G. 2011. Unconscious transfer of meaning to brands. Journal of Consumer Psychology 21(3): 215-225.

[4] Watanabe, N. and Haruno, M. 2015. Effects of subconscious and conscious emotions on human cue–reward association learning. Scientific reports, 5.

[5] Silver, D.; Huang, A.; Maddison, C. J.; Guez, A.; Sifre, L.; Van Den Driessche, G.; Schrittwieser, J.; Antonoglou, I.; Pan- neershelvam, V.; Lanctot, M.; and others. 2016. Mastering the game of go with deep neural networks and tree search. Nature 529(7587): 484-489.

[6] Taigman, Y., Yang, M., Ranzato, M.A. and Wolf, L. 2014. Deep- face: Closing the gap to human-level performance in face verifi- cation. In Proceedings of the IEEE conference on computer vision and pattern recognition, 1701-1708.

[7] Szegedy, C.; Liu, W.; Jia, Y.; Sermanet, P.; Reed, S.; Anguelov, D.; Erhan, D.; Vanhoucke V; and Rabinovich, A. 2015. Going deeper with convolutions. In Proceedings of the IEEE conference on computer vision and pattern recognition, 1-9.

[8] Cheng, H. T.; Koc, L.; Harmsen, J.; Shaked, T.; Chandra, T.; Aradhye, H.; and others. 2016. Wide & deep learning for recom- mender systems. In Proceedings of the 1st Workshop on Deep Learning for Recommender Systems, 7-10.


文章来源:砍柴网

《OpenCV计算机视觉产品实战》本课程关注怎样运用OpenCV编写程序,解决实际项目问题,课程注重运用而非理论,因此即使你不具备基础知识,但是在一步一步的讲解中,按图索骥,也能够快速入门,并且建立起知识框架;对于具备一定基础的开发者来说,学习本门课程能够加速对图像处理程序的理解,并且逐渐积累起自己的开发框架。点击下方二维码报名课程

登录查看更多
2

相关内容

京东推荐为京东全站提供平台化的推荐能力,涵盖首页为你推荐、购物车、我京等核心重点推荐位。
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
专知会员服务
87+阅读 · 2020年1月20日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
南洋理工大学,深度学习推荐系统综述
专知会员服务
174+阅读 · 2019年10月14日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
爆料 | 解析阿里妈妈如何将深度学习应用在广告、推荐及搜索业务
机器学习算法与Python学习
5+阅读 · 2018年5月14日
推荐|今日头条公布其算法原理(全)
全球人工智能
7+阅读 · 2018年1月16日
深度解析京东个性化推荐系统演进史
CSDN云计算
6+阅读 · 2017年12月11日
【推荐系统】深度解析京东个性化推荐系统演进史
产业智能官
23+阅读 · 2017年12月8日
史上最全!阿里智能人机交互的核心技术解析
阿里技术
4+阅读 · 2017年12月2日
【深度学习】深度学习在美团点评的应用
产业智能官
3+阅读 · 2017年11月1日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Compositional Generalization in Image Captioning
Arxiv
3+阅读 · 2019年9月16日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
7+阅读 · 2018年3月19日
Arxiv
3+阅读 · 2017年11月21日
VIP会员
相关VIP内容
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
80+阅读 · 2020年5月5日
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
专知会员服务
87+阅读 · 2020年1月20日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
96+阅读 · 2019年12月14日
南洋理工大学,深度学习推荐系统综述
专知会员服务
174+阅读 · 2019年10月14日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员