会员服务 ·

0

WWW2022 | 基于交叉成对排序的无偏推荐算法

2022 年 4 月 20 日 机器学习与推荐算法

嘿，记得给“机器学习与推荐算法”添加星标

现有大多数推荐系统都是对观测到的交互数据进行优化，而这些数据受到之前曝光机制的影响，会表现出许多偏差，比如流行偏差。经常使用的基于pointwise的二元交叉熵和pairwise的贝叶斯个性化排序损失函数，并不是专门设计来考虑观测数据的偏差的。因此，对损失进行优化的模型仍然会存在数据偏差，甚至会放大数据偏差。例如，少数受欢迎的商品占据了越来越多的曝光机会，严重损害了小众物品的推荐质量。

在接下来介绍的这篇工作中，其开发了一种新的学习范式CPR，全称为Cross Pairwise Ranking，其实现了在不知道曝光机制的情况下不带偏见的推荐。与反倾向评分(IPS)不同，该工作改变了样本的损失项，并创新性地对多次观察到的交互作用进行抽样，并将其作为预测的组合形成损失。另外还在理论上证明了这种方法抵消了用户/物品倾向对学习的影响，消除了曝光机制引起的数据偏差的影响。对IPS有利的是，所提出的CPR确保每个训练实例的无偏学习，而不需要设置倾向分数。实验结果表明，该方法在模型泛化和训练效率方面均优于最新的去偏方法。

论文地址： http://staff.ustc.edu.cn/~hexn/papers/www22-cpr.pdf

Github地址： https://github.com/Qcactus/CPR

1 Motivation

现有方法的损失函数（例如最常用的二元交叉熵和成对贝叶斯个性化排名）并非旨在考虑观测数据中的偏差。因此，针对这类损失进行优化的模型将继承数据偏差，甚至会放大偏差。因此，作者设计了一种新的学习范式命名为，从而在不知道曝光机制的同时实现无偏推荐。

2 Preliminaries

2.1 Biasedness of Pointwise and Pairwise Loss

作者指出了现有的pointwise损失和pairwise损失都是有偏的。

论文中以二元交叉熵为例。

其中是观测到的交互和未观测到的交互的总集合，表示用户对物品有过交互，反之，表示用户和物品之间的预测分数。当时，越大越好，相反，越小越好，即：

为了极大化观测的概率，作者对按照以下条件排序：

由于

因此上述公式改写为：

通过对比可发现，pointwise损失实际上是用去拟合

，而越流行的物品越大，因为流行物品曝光机率更高。因此pointwise损失是有偏的。

证明pairwise损失有偏与pointwise类似，具体细节可参照原文。

3 Method

3.1 CPR Loss

其中

为训练数据。CPR损失鼓励两个正样本的预测分数之和高于两个负样本的预测分数之和，即：

作者基于曝光概率可以分解为用户倾向，物品倾向和用户-物品相关性这一假设，证明了CPR损失的无偏性。这一假设可形式化的表述为

基于这一假设，期望的排序可以改写为：

因此，

通过对上述四项的组合得到

因此CPR损失是无偏的。

3.2 Extending to More Interactions

上述对于CPR损失的讨论仅限于包含两组观测到的正样本，以下将其拓展到多组正样本：

作者提出了以一种动态采样方法去构建样本集合，具体流程如下：

3.3 Discussion

作者在论文中还讨论了CPR与基于IPS的方法，setwise排序的不同，具体细节参照论文。

4 Experiments

Datasets

Metrics

Recall@K, NDCG@K and ARP@K

Baselines

BPR, Multi-VAE, CausE, Rel-MF, UBPR, DICE

Results

可以看出，在三个数据集上，CPR都取得了明显的性能提升。

CPR方法相较于其他方法能够更早收敛到最优，训练时间也相较于baseline更短。

可以看出物品被推荐的概率随着组ID的增大而减小，说明流行物品被推荐的概率逐渐降低。

可以看出CPR损失不论应用在哪些backbone上，都明显优于baseline。

更多实验细节参考原文。

欢迎干货投稿 \ 论文宣传 \ 合作交流

推荐阅读

论文周报 | 推荐系统领域最新研究进展

SIGIR2022 | 推荐系统论文集锦

当推荐系统遇上多模态Embedding

由于公众号试行乱序推送，您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容，请将本号设为星标，以及常点文末右下角的“在看”。

喜欢的话点个在看吧👇

登录查看更多

0

相关内容

【WWW2022】用于分布外推荐的因果表征学习

【WWW2022】用于分布外推荐的因果表征学习

专知会员服务

20+阅读 · 2022年5月11日

WWW 2022 ：基于纯MLP架构的序列推荐模型

WWW 2022 ：基于纯MLP架构的序列推荐模型

专知会员服务

16+阅读 · 2022年3月20日

【AAAI2022】多任务推荐中的跨任务知识提炼

【AAAI2022】多任务推荐中的跨任务知识提炼

专知会员服务

25+阅读 · 2022年2月22日

【CIKM2021】用户行为序列对比学习的上下文感知文档排序

专知会员服务

20+阅读 · 2021年8月30日

【WWW2021 】洛伦兹图卷积神经网络

专知会员服务

44+阅读 · 2021年5月26日

【WWW2021】大规模组合K推荐

【WWW2021】大规模组合K推荐

专知会员服务

44+阅读 · 2021年5月3日

【WWW2021】DGCN:利用图卷积网络进行多样化推荐

专知会员服务

37+阅读 · 2021年4月18日

【WWW2021】场矩阵分解机推荐系统

【WWW2021】场矩阵分解机推荐系统

专知会员服务

33+阅读 · 2021年2月27日

【WWW2021】兴趣感知消息传递图卷积神经网络的推荐

【WWW2021】兴趣感知消息传递图卷积神经网络的推荐

专知会员服务

45+阅读 · 2021年2月23日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

WWW2022@教程 | 基于对比学习的推荐系统

WWW2022@教程 | 基于对比学习的推荐系统

机器学习与推荐算法

4+阅读 · 2022年4月26日

WWW'22 | 推荐系统：基于邻域关系的对比学习改进图协同过滤

WWW'22 | 推荐系统：基于邻域关系的对比学习改进图协同过滤

RUC AI Box

2+阅读 · 2022年3月21日

基于图的推荐中的负采样原则 | 论文荐读

基于图的推荐中的负采样原则 | 论文荐读

学术头条

1+阅读 · 2022年3月15日

最全推荐系统传统算法合集

最全推荐系统传统算法合集

机器学习与推荐算法

0+阅读 · 2022年1月24日

WSDM 2022 | 基于图神经网络的协同过滤设计空间研究

WSDM 2022 | 基于图神经网络的协同过滤设计空间研究

专知

1+阅读 · 2022年1月3日

WWW'21 | 基于图的视角学习推荐系统的公平表征

WWW'21 | 基于图的视角学习推荐系统的公平表征

图与推荐

0+阅读 · 2021年12月11日

SIGIR2021 | 基于排序的推荐系统度量优化新视角

SIGIR2021 | 基于排序的推荐系统度量优化新视角

机器学习与推荐算法

1+阅读 · 2021年12月6日

推荐只需要精确？顶会论文看多样化推荐研究趋势

推荐只需要精确？顶会论文看多样化推荐研究趋势

PaperWeekly

0+阅读 · 2021年11月28日

KDD21 | 如何纠正推荐系统中的流行度偏差

KDD21 | 如何纠正推荐系统中的流行度偏差

图与推荐

1+阅读 · 2021年11月25日

基于对比学习的推荐算法总结

基于对比学习的推荐算法总结

机器学习与推荐算法

1+阅读 · 2021年9月16日

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

再生核希尔伯特空间图像稀疏表达算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于稀疏隐语义分析与众包的查询意图发现与推荐算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于行列软判决反馈的频率选择性MIMO信道信号检测与LDPC码优化

国家自然科学基金

0+阅读 · 2012年12月31日

基于感知信息的语音增强及客观质量评估

国家自然科学基金

0+阅读 · 2012年12月31日

面向物流行业的车辆路径问题研究与系统实现

国家自然科学基金

1+阅读 · 2012年12月31日

多级交换结构中的公平调度算法及偏射机制

国家自然科学基金

0+阅读 · 2012年12月31日

CrossCBR: Cross-view Contrastive Learning for Bundle Recommendation

Arxiv

0+阅读 · 2022年6月8日

Beyond Value: CHECKLIST for Testing Inferences in Planning-Based RL

Arxiv

0+阅读 · 2022年6月7日

Enhancing Dual-Encoders with Question and Answer Cross-Embeddings for Answer Retrieval

Arxiv

0+阅读 · 2022年6月7日

Simple Mechanisms for Welfare Maximization in Rich Advertising Auctions

Arxiv

0+阅读 · 2022年6月6日

Neural Collaborative Reasoning

Arxiv

13+阅读 · 2021年5月3日

RetaGNN: Relational Temporal Attentive Graph Neural Networks for Holistic Sequential Recommendation

RetaGNN: Relational Temporal Attentive Graph Neural Networks for Holistic Sequential Recommendation

Arxiv

14+阅读 · 2021年1月29日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Cold-start Sequential Recommendation via Meta Learner

Cold-start Sequential Recommendation via Meta Learner

Arxiv

15+阅读 · 2020年12月10日

Memory Augmented Graph Neural Networks for Sequential Recommendation

Memory Augmented Graph Neural Networks for Sequential Recommendation

Arxiv

13+阅读 · 2019年12月26日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

VIP会员

相关主题

相关VIP内容

【WWW2022】用于分布外推荐的因果表征学习

【WWW2022】用于分布外推荐的因果表征学习

专知会员服务

20+阅读 · 2022年5月11日

WWW 2022 ：基于纯MLP架构的序列推荐模型

WWW 2022 ：基于纯MLP架构的序列推荐模型

专知会员服务

16+阅读 · 2022年3月20日

【AAAI2022】多任务推荐中的跨任务知识提炼

【AAAI2022】多任务推荐中的跨任务知识提炼

专知会员服务

25+阅读 · 2022年2月22日

【CIKM2021】用户行为序列对比学习的上下文感知文档排序

专知会员服务

20+阅读 · 2021年8月30日

【WWW2021 】洛伦兹图卷积神经网络

专知会员服务

44+阅读 · 2021年5月26日

【WWW2021】大规模组合K推荐

【WWW2021】大规模组合K推荐

专知会员服务

44+阅读 · 2021年5月3日

【WWW2021】DGCN:利用图卷积网络进行多样化推荐

专知会员服务

37+阅读 · 2021年4月18日

【WWW2021】场矩阵分解机推荐系统

【WWW2021】场矩阵分解机推荐系统

专知会员服务

33+阅读 · 2021年2月27日

【WWW2021】兴趣感知消息传递图卷积神经网络的推荐

【WWW2021】兴趣感知消息传递图卷积神经网络的推荐

专知会员服务

45+阅读 · 2021年2月23日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

WWW2022@教程 | 基于对比学习的推荐系统

WWW2022@教程 | 基于对比学习的推荐系统

机器学习与推荐算法

4+阅读 · 2022年4月26日

WWW'22 | 推荐系统：基于邻域关系的对比学习改进图协同过滤

WWW'22 | 推荐系统：基于邻域关系的对比学习改进图协同过滤

RUC AI Box

2+阅读 · 2022年3月21日

基于图的推荐中的负采样原则 | 论文荐读

基于图的推荐中的负采样原则 | 论文荐读

学术头条

1+阅读 · 2022年3月15日

最全推荐系统传统算法合集

最全推荐系统传统算法合集

机器学习与推荐算法

0+阅读 · 2022年1月24日

WSDM 2022 | 基于图神经网络的协同过滤设计空间研究

WSDM 2022 | 基于图神经网络的协同过滤设计空间研究

专知

1+阅读 · 2022年1月3日

WWW'21 | 基于图的视角学习推荐系统的公平表征

WWW'21 | 基于图的视角学习推荐系统的公平表征

图与推荐

0+阅读 · 2021年12月11日

SIGIR2021 | 基于排序的推荐系统度量优化新视角

SIGIR2021 | 基于排序的推荐系统度量优化新视角

机器学习与推荐算法

1+阅读 · 2021年12月6日

推荐只需要精确？顶会论文看多样化推荐研究趋势

推荐只需要精确？顶会论文看多样化推荐研究趋势

PaperWeekly

0+阅读 · 2021年11月28日

KDD21 | 如何纠正推荐系统中的流行度偏差

KDD21 | 如何纠正推荐系统中的流行度偏差

图与推荐

1+阅读 · 2021年11月25日

基于对比学习的推荐算法总结

基于对比学习的推荐算法总结

机器学习与推荐算法

1+阅读 · 2021年9月16日

相关基金

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

再生核希尔伯特空间图像稀疏表达算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于稀疏隐语义分析与众包的查询意图发现与推荐算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于行列软判决反馈的频率选择性MIMO信道信号检测与LDPC码优化

国家自然科学基金

0+阅读 · 2012年12月31日

基于感知信息的语音增强及客观质量评估

国家自然科学基金

0+阅读 · 2012年12月31日

面向物流行业的车辆路径问题研究与系统实现

国家自然科学基金

1+阅读 · 2012年12月31日

多级交换结构中的公平调度算法及偏射机制

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

CrossCBR: Cross-view Contrastive Learning for Bundle Recommendation

Arxiv

0+阅读 · 2022年6月8日

Beyond Value: CHECKLIST for Testing Inferences in Planning-Based RL

Arxiv

0+阅读 · 2022年6月7日

Enhancing Dual-Encoders with Question and Answer Cross-Embeddings for Answer Retrieval

Arxiv

0+阅读 · 2022年6月7日

Simple Mechanisms for Welfare Maximization in Rich Advertising Auctions

Arxiv

0+阅读 · 2022年6月6日

Neural Collaborative Reasoning

Arxiv

13+阅读 · 2021年5月3日

RetaGNN: Relational Temporal Attentive Graph Neural Networks for Holistic Sequential Recommendation

RetaGNN: Relational Temporal Attentive Graph Neural Networks for Holistic Sequential Recommendation

Arxiv

14+阅读 · 2021年1月29日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Cold-start Sequential Recommendation via Meta Learner

Cold-start Sequential Recommendation via Meta Learner

Arxiv

15+阅读 · 2020年12月10日

Memory Augmented Graph Neural Networks for Sequential Recommendation

Memory Augmented Graph Neural Networks for Sequential Recommendation

Arxiv

13+阅读 · 2019年12月26日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

大家都在搜

久别重逢话双塔

大型语言模型

CMU博士论文

软件无线电

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员