Evaluating the causal effect of recommendations is an important objective because the causal effect on user interactions can directly leads to an increase in sales and user engagement. To select an optimal recommendation model, it is common to conduct A/B testing to compare model performance. However, A/B testing of causal effects requires a large number of users, making such experiments costly and risky. We therefore propose the first interleaving methods that can efficiently compare recommendation models in terms of causal effects. In contrast to conventional interleaving methods, we measure the outcomes of both items on an interleaved list and items not on the interleaved list, since the causal effect is the difference between outcomes with and without recommendations. To ensure that the evaluations are unbiased, we either select items with equal probability or weight the outcomes using inverse propensity scores. We then verify the unbiasedness and efficiency of online evaluation methods through simulated online experiments. The results indicate that our proposed methods are unbiased and that they have superior efficiency to A/B testing.


翻译:评估建议的因果关系是一个重要目标,因为对用户互动的因果关系可直接导致销售量和用户参与的增加。选择最佳建议模式,通常的做法是进行A/B测试,以比较示范性业绩。然而,对因果关系的测试需要大量用户,使这种实验成本高、风险大。因此,我们提出第一种互连方法,可以有效地比较建议模式的因果关系效果。与传统的互连方法不同,我们衡量两个项目在互连清单上的结果和不在互连名单上的结果,因为因果关系是结果与建议之间的差别。为了确保评价是公正的,我们选择的概率相等的项目,或者用反偏向分数来权衡结果。我们随后通过模拟在线试验来核查在线评价方法的公正性和效率。结果显示,我们提出的方法是不带偏见的,它们比A/B测试更有效率。

0
下载
关闭预览

相关内容

专知会员服务
94+阅读 · 2021年8月28日
因果推断,Causal Inference:The Mixtape
专知会员服务
105+阅读 · 2021年8月27日
【2020新书】社交媒体挖掘,212pdf,Mining Social Media
专知会员服务
60+阅读 · 2020年7月30日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
已删除
inpluslab
8+阅读 · 2019年10月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
3+阅读 · 2020年2月12日
Arxiv
23+阅读 · 2018年8月3日
Arxiv
6+阅读 · 2018年3月28日
VIP会员
相关资讯
已删除
inpluslab
8+阅读 · 2019年10月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员