链接 | mp.weixin.qq.com/s/QpwExdQi_lLvH26wvWqmEA
链接 | https://zhuanlan.zhihu.com/p/181677461
编辑 | 机器学习与推荐算法公众号
概述:近年来,深度学习在序列化推荐领域取得了巨大成功,已有的序列化推荐模型通常依赖于商品预测的损失函数进行参数训练。但是该损失函数会导致数据稀疏和过拟合问题,其忽视了上下文数据与序列数据之间的关联,使得数据的表示学习的并不充分。为解决该问题,本文提出了S3-Rec这一模型,该模型基于自注意力模型框架,利用四个额外的自监督训练函数来学习属性、商品、序列之间的特殊关系。在这里,本文采用了互信息最大化技术来构造这些自监督函数,以此来统一这些关系。在六个数据集上的充分实验表明本文提出的模型能够取得State-of-the-art的效果,其在数据量受限和其他推荐模型上也能带来较大的提升。关于自监督学习可参考Self-Supervised Learning论文整理。
作者:李祥圣,Maarten de Rijke, 刘奕群,毛佳昕,马为之,张敏,马少平
概述:目前的检索模型多数基于文本间的匹配。然而,对于一个搜索会话,用户的行为之间是具有联系的,这样的联系可以用图的方式表示出来。例如用户在会话搜索中修改查询的过程可以知道那些查询之间是相似的,用户点击文档后,可以知道查询与文档之间的关联性。利用这样的两个网络,我们可以构建一个由用户行为组成的图网络。在传统的文本匹配模式上,进一步地引入行为图信息帮助检索模型更好地理解用户搜索意图。检索模型可以利用图信息,对输入的查询进行相似节点查询。同理,对于候选文档也可以利用相似节点查询。通过引入邻接节点信息,丰富当前节点的语义表示。
现有的图模型的工作主要分为两种:网络嵌入式表示方法与图神经网络方法。基于这两种方法,我们提出了两种利用图信息改进检索模型的方法,两种方法的示意图如下所示:
概述:推荐系统可以帮助用户很方便的从在线服务中获取想要的信息,在提升用户体验方面起着越来越重要的作用,也累计了越来越多的用户数据。随着图神经网络(GNNs)的出现,基于用户-物品二部图来学习用户、物品表达展现出了巨大的优势。但是,GNN模型的训练复杂度很高,难以频繁地更新以提供最新的用户、物品个性化表达。在本研究中,我们提出通过增量的方式更新基于GNN的推荐模型,以大大缩短训练时间,从而可以更频繁地更新模型。我们设计了一种图结构感知增量学习框架GraphSAIL,以克服在增量方式训练模型时常常出现的灾难性遗忘问题。GraphSAIL实现了一种可以保存每个节点的局部结构、全局结构和自信息的图结构信息保存策略,从而在增量更新期间可以更好的保留用户的长期偏好(以及物品的长期属性)。GraphSAIL是首个对基于GNN的推荐模型进行增量更新的框架,在两个公共数据集上与其它增量学习技术的对比展示出了GraphSAIL的优越性。我们进一步在大规模工业数据集上验证了我们的框架的有效性。
图1:GraphSAIL全局结构蒸馏示例
题目:Personalized Re-ranking with Item Relationships for E-commerce
概述:标签感知推荐系统 (Tag-aware recommender systems)利用了用户对物品的标注标签作为一种辅助信息来提升推荐性能,传统的基于深度学习的标签感知推荐模型单纯依靠基于标签的特征来表征用户和物品,这种方式难以有效解决标签空间的稀疏性、模糊性和冗余性等弊端。为了解决这个问题,我们将用户的标注记录以无向带权异构图的形式进行组织,通过邻居来提供额外的内容信息。在本工作中,我们提出了一个基于图神经网络的模型TGCN。TGCN针对不同类型的邻居节点采用不同的采样和聚合操作,并利用注意力网络来识别邻居和节点类型的重要性。此外,利用卷积神经网络作为类型聚合方式从而建模多粒度的特征交互。我们在公开数据集和产品数据集进行验证,TGCN模型在各个评价指标上均优于现有的标签感知推荐模型。【诺亚推荐与搜索团队自研成果】
图3:TGCN模型结构
题目:U-rank: Utility-oriented Learning to Rank with Implicit Feedback
概述:使用隐式反馈进行排序学习是许多现有信息系统、推荐系统最重要的任务之一。信息系统、推荐系统一般都有特定的优化目标,例如,增加点击量和提高收入。我们泛称该优化目标为收益。很多时候,我们希望有一个算法能够直接最优化收益。然而,现有的排序算法原则并不能够最大化收益。为此,我们提出了一种新型排序框架,U-rank,将期望收益最大化的问题建模为物品和位置的二分图最大权重匹配问题。该框架考虑位置偏置对收益的影响,通过借助位置感知的深度点击率预测模型,计算二分图的权重为在特定query下该物品被放到某个位置的收益。我们借鉴了有效的Lambdaloss框架来最大化该二分图匹配问题,这个框架得到了理论和经验分析的支持。我们在三个benchmark数据集和二个的私有数据集上进行了大量的实验,充分展示了U-rank在优化收益的目标上表现优于许多state-of-the-arts算法。此外,U-rank已经部署到一个商业推荐系统,线上A/B测试中观察到U-rank相对生产基线大幅提升了点击率和转化率。【诺亚推荐与搜索团队,上海交大Apex实验室俞勇/张伟楠老师团队联合研究成果】
图4:将排序问题建模成二分图最大权重匹配问题
题目:AutoFeature: Searching for Feature Interactions and Their Architectures for Click-through Rate Prediction
图5:AutoFeature的神经网络架构搜索流程图
参考链接:
http://ai.ruc.edu.cn/newslist/newsdetail/20200818001.html
https://zhuanlan.zhihu.com/p/181677461