【KDD2020-阿里】多任务多视角图表示学习的推荐系统

2020 年 7 月 2 日 专知

论文:M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems

地址:https://www.zhuanzhi.ai/paper/68ea1faf8552fd81d0d17c9a8c916040


摘要


将图表示学习与多视图数据(附加信息)相结合进行推荐是行业发展的趋势。现有的方法大多可以归类为多视图表示融合:他们首先构建一个图,然后将多视图数据集成到图中每个节点的一个紧凑表示中。然而,这些方法在工程和算法方面会带来一些问题

  • 多视图数据在工业界是丰富的,信息量大,可能超过单个向量节点的容量;

  • 由于多视图数据往往来自不同的分布,可能会引入归纳偏差。


在本文中,我们使用一种多视图表示对齐方法来解决这个问题。特别地,我们提出了一个多任务多视图图表示学习框架(M2GRL)来学习大规模推荐系统的多视图图的节点表示。M2GRL为每个单视图数据构造一个图,从多个图中学习多个单独的表示,并对跨视图关系进行对齐。M2GRL选择多任务学习范式,共同学习视图内表示和跨视图关系。此外,M2GRL利用同方差不确定性自适应调整训练任务的权重损失。我们在淘宝上部署了M2GRL,并在570亿个例子上训练它。根据离线指标和在线A/B测试,M2GRL的效果显著优于当前SOTA的算法。淘宝多样性推荐的进一步探索表明了利用M2GRL所产生的多种表示的有效性,本文认为这对于不同侧重点的行业推荐任务是一个很有前景的方向。


问题定义


本文的任务是在电商场景中如何学习高质量的item表示。根据item特征的分类,我们为item生成多种表示。具体来说,本文中使用了三种视图的数据:user-item互动数据视图;item分类数据视图;item所属shop数据视图。


图的构建:根据用户行为序列,首先分别为上述三种视图构造三个图(item图、分类图以及shop图)。以item图为例,如果在一个用户的行为序列中的两个item是相邻的我们便认为两个item是相连的。分类图和shop图也是类似的构建思路。


节点序列采样:用于生成训练样本节点序列常见的方法是随机游走以及相应的变种。本文通过从用户行为序列中抽取session来生成训练样本,主要的步骤:

  • 数据清理。我们注意到用户有的时候会点击一个item,然后迅速回退到前一个页面也就是说用户对之前点击的item并不感兴趣。因此我们将停留时间不超过2s的item进行移除;

  • Session的分拆与合并。有的时候用户的session可能长达几个小时(后台运行),我们通过记录用户打开和退出淘宝APP的时间对于空闲间隔时间超过一小时的session进行分拆,并且对于空闲间隔时间在30分钟内的session进行合并。 


M2GRL总体框架


M2GRL包含两种类型的任务:视图内任务和视图间任务。视图内任务学习单个视图内的节点表示,视图间任务则针对不同视图的图关系进行建模。

参考链接:

推荐技术

https://mp.weixin.qq.com/s/ka39SrQrXKJOtN-3wPbbJQ


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“M2GRL” 可以获取《KDD2020-阿里】多任务多视角图表示学习的推荐系统》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
欢迎扫一扫关注专知视频号,第一时间看人工智能最新精彩视频!

点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源
登录查看更多
2

相关内容

【KDD2020教程】多模态网络表示学习
专知会员服务
130+阅读 · 2020年8月26日
【KDD2020-阿里】可调控的多兴趣推荐框架
专知会员服务
29+阅读 · 2020年8月11日
【ICML2020】对比多视角表示学习
专知会员服务
53+阅读 · 2020年6月28日
【ICML2020】多视角对比图表示学习,Contrastive Multi-View GRL
专知会员服务
80+阅读 · 2020年6月11日
【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector
专知会员服务
56+阅读 · 2020年2月10日
论文荐读:理解图表示学习中的负采样
学术头条
29+阅读 · 2020年5月29日
【论文解读】“推荐系统”加上“图神经网络”
深度学习自然语言处理
16+阅读 · 2020年3月31日
“推荐系统”加上“图神经网络”
机器学习与推荐算法
12+阅读 · 2020年3月23日
如何将知识图谱特征学习应用到推荐系统?
微软研究院AI头条
7+阅读 · 2018年6月5日
Arxiv
8+阅读 · 2019年5月20日
Arxiv
10+阅读 · 2019年2月19日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
5+阅读 · 2017年11月13日
VIP会员
Top
微信扫码咨询专知VIP会员