ACM(国际计算机学会)主办的推荐系统专场(Resys)是推荐系统圈子的顶级会议,从2007年开始,至今已经十年,这十年中每年都有Tutorial公布,本文整理出来,可以一探推荐系统的业界和学界兴趣点的迁移。
十年回顾
2007
本年度并没有公开的Tutorial,但从会议收录的文章主题,可以看到本届会议重点讨论的话题是:隐私和信任,协同过滤
2008
1. Robust Recommender Systems
作者:Robin Burke (DePaul University)
主题:关于推荐系统的健壮性,主要有:对推荐模型的攻击种类,量化分析攻击产生的影响,推荐算法替代方案,留住用户的信任,对攻击方的检测。
关键词:健壮性,推荐系统安全
2. Recent Progress in Collaborative Filtering
作者:Yehuda Koren (Bell Labs)
主题:以Netflix Prize比赛为主线,回顾了协同过滤相关算法的前世今生。同时,强调推荐系统是一个多目标优化的系统,所以也对多种效果评价指标做了对比。
关键词:协同过滤,多目标优化,效果评价
3. Context-Aware Recommender Systems
作者:Gedas Adomavicius (University of Minnesota) and Alex Tuzhilin (NYU)
主题:传统推荐系统致力于给用户找出相关的物品,但是仅仅是这样已经不够了,现在(注意这时候是2008年)需要根据当时所在时间和位置给出更合适宜的推荐,比如旅行推荐。这就是所谓考虑上下文信息或者说场景的推荐系统。
关键词:场景信息
2009
1. Important Research Challenges in Recommenders
作者:John Riedl (University of Minnesota), John Sanders (Netflix) and Todd Beaupre (Yahoo!)
主题:回顾了个人在从事推荐系统研究过程中所遇到的挑战:透明度,EE问题,防沉迷,兴趣迁移,长短期兴趣融合,读懂用户行为的含义,效果评价。
关键词:透明度,EE问题,效果评价。
2. Bayesian Modeling for Recommender Systems
作者:Asim Ansari (Columbia University)
主题:关于在推荐系统建模中的贝叶斯身影。
关键词:贝叶斯
3. Using Social Trust for Recommender Systems
作者:Jennifer Golbeck (University of Maryland)
主题:在推荐系统中引入社交关系以增强推荐结果的信任度,从而提升推荐系统的效果。
关键词:社交推荐,信任度
2010
1. Evaluating Recommender Systems
作者:Guy Shani
主题:关于如何评价推荐系统的问题,分为在线和离线两部分。分别详细降到了离线阶段如何模拟用户行为做一个实验,在现阶段如何做一个实验,并讨论了用户研究、用户体验等泛技术领域话题。
关键词:效果评价
2. HCI for Recommender Systems: An Introduction
作者:Joseph A. Konstan
主题:介绍人机交互概念、技术,讨论推荐系统中关于交互设计的影响。
关键词:人机交互
3. Query Intent Prediction and Recommendation
作者:Ricardo Baeza-Yates
主题:查询意图是搜索引擎的技术范畴,但用户明确提交一个查询本身就反映了非常明确的用户需求和兴趣,所以本人就探讨了查询意图识别在推荐系统中的应用。同时,还在搜索中尝试了相关搜索推荐。
关键词:查询意图,搜索引擎
2011
1. Music Recommendation and Discovery Revisited
作者: Òscar Celma (BMAT) and Paul Lamere (The Echo Nest)
主题:回顾总结了在线音乐应用的推荐系统原理,挑战,以及那些可能用于在未来(站在2011年)提升音乐推荐系统效果的技术。
关键词:音乐推荐
2. Robustness of Recommender Systems
作者:Neil Hurley (UCD)
主题:讨论推荐系统的攻击,列举了近十年来(站在2011年)真实发生的推荐系统攻击案例,总结其中的特点,为了更好的加强推荐系统的健壮性。
关键词:健壮性,推荐系统安全
3. Recommendations as a Conversation with the User
作者:Daniel Tunkelang (LinkedIn)
主题:把推荐系统看成是用户和信息获取平台之间的对话通道,会是什么样的情形?
关键词:人机交互,对话系统
2012
1. Conducting User Experiments in Recommender Systems
作者:Bart Knijnenburg (UC Irvine)
主题:我们一直以来就是聚焦于离线阶段用量化的指标去评价推荐系统的算法效果,但是如何去评价用户体验呢?用户体验是主观的,毕竟我们无法知道每个人内心的感受。本文主要讨论推荐系统中如何考虑用户体验。
关键词:用户体验,效果评价
2. Personality-based Recommender Systems: An Overview
作者: Maria Augusta S. N. Nunes (UF Sergipe) Rong Hu (EPFL)
主题:介绍了人这种非理性动物在做决策时的个性因素,及其对推荐系统的启发,把“个性化”和“推荐系统”放在一起考量,同时介绍了实现个性化的推荐系统需要哪些关键技术,以及会遇到哪些挑战。
关键词:个性化
3. Building Industrial-scale Real-world Recommender Systems
作者:Xavier Amatriain (Netflix)
主题:这是当时的Netflix算法总监(现在已经是Quora主管工程的副总裁)总结的工业级推荐系统经验。推荐系统每年的论文层出不穷,但如何才能在自己的商业系统中将其落地,是很多人关心的头等大事,对此本文总结了若干要点。可扩展性,低延迟等工业级系统的要求要考虑,模型方面,除了准确性,还有新鲜度,新奇度,透明度也是工业级推荐系统要考虑的。以Netflix的生产系统为例将这些问题做了逐一梳理。
关键词:工业级
4. Best Practices Tutorial and Panel Discussion: The Challenge of Recommender Systems Challenges
作者:Alan Said (TU Berlin), Domonkos Tikk (Gravity) and Andreas Hotho (U Wurzburg)
主题:近年来组织的推荐系统相关比赛很多,以Netflix Prize, KDD Cup为典型代表,这些比赛为推荐系统领域贡献了很多优秀的开发经验,那么到底赢得一场这样的比赛有哪些关键点要做好呢?本文就此讨论了一番。
关键词:推荐系统比赛,最佳实践
2013
1. Invited Tutorial: Mining Social Networks for Recommendation
作者: Martin Ester (Simon Fraser University, Canada)
主题:社交信息可以为推荐系统带来贡献,这几乎是共识,但到底带来什么贡献?怎么带来贡献?为冷启动问题贡献用户个人信息,是一个典型的应用。社交网络上的好友推荐也是个典型应用。未来有哪些方向可以尝试或者挑战?把社交网络看成一个分布式网络,P2P网络,以及如何保护隐私的问题。
关键词:社交网络
2. Learning to Rank
作者: Alexandros Karatzoglou (Telefonica Research, Spain), Linas Baltrunas (Telefonica Research, Spain) & Yue Shi (Delft University of Technology, Netherlands)
主题: 本文讨论排序模型在推荐系统的应用,现有模型的优劣区别,未来的可能发展方向。
关键词:LTR,排序模型
3. Beyond Friendship: The Art, Science and Applications of Recommending People to People in Social Networks
作者:Luiz Augusto Pizzato (University of Sydney, Australia) & Anmol Bhasin (LinkedIn, USA)
主题:关于社交网络推荐系统,不只是建立社交关系那么简单。本文深入讨论了这个问题,首先描述了经典方法如链接分析和协同过滤方法,接着深入讨论了诸如相互作用,基于用户之间的社交图谱的好友推荐,内容来自作者在LinkedIn的第一线工作内容。
关键词:社交网络
3. Preference Handling
作者: Alexis Tsoukiàs (Université Paris Dauphine, France) & Paolo Viappiani (Université Pierre et Marie Curie, France)
主题:关于用户偏好研究。用户偏好不止是推荐系统的研究对象,它是很多其他领域的关注点:博弈论,决策论等。文中还讨论了在推荐系统中,用户偏好如何学习和融合。
关键词:用户偏好
2014
1. The Recommender Problem Revisited
作者:Xavier Amatriain (Netflix Inc., USA)
主题:本文回顾了Netflix Prize比赛用均方根误差简化了推荐系统的问题,实际上一个现代的商业推荐系统中,还要考虑:个性化排序,相似度,推荐解释,场景信息(上下文信息),和搜索引擎的结合。还回顾了一些重要的推荐模型,Factorization Machines, Restricted Boltzmann Machines, SimRank, Deep Neural Networks, Listwise Learning-to-rank。
关键词:工业级,场景信息
2. Personalized Location Recommendation on Location-based Social Networks
作者:Huiji Gao, Jiliang Tang, and Huan Liu (Arizona State University, USA)
主题:移动互联网的崛起,推荐系统可以接入的数据更多,应对的场景更丰富,上传地理位置,随时随地在社交网络上分享内容,这些都可以引入到社交推荐中了。本文从数据挖掘的角度去介绍当这些数据引入后有哪些新的尝试。
关键词:社交网络,地理位置
3. Cross-Domain Recommender Systems
作者:Ivan Cantador (Universidad Autónoma de Madrid, Spain) and Paolo Cremonesi (Politecnico di Milano, Italy)
主题:社交电商中,用户提供的信息是跨领域的。用户在不同系统中产生的反馈,填写的资料可以互相交叉使用,尤其是:解决冷启动问题得到更好的推荐效果,解决数据稀疏问题得到更好的用户模型。本文针对跨领域的推荐系统,分别从用户建模、推荐系统、机器学习等角度讨论了这一问题。
关键词:跨领域,冷启动
4. Social Recommender Systems
作者:Ido Guy (Yahoo! Labs) and Werner Geyer (IBM Research)
主题:本文是全面梳理社交网络推荐系统的一篇综述性Tutorial。
关键词:社交网络
2015
1. Replicable Evaluation of Recommender Systems
作者:Alan Said (Recorded Future, Sweden) and Alejandro Bellogín (Universidad Autónoma de Madrid, Spain)
主题:推荐系统的效果评价一直是受多种因素影响的,尤其是对比两个推荐模型更不是那么容易。本文为你展示了一种非常清晰明了的方式来评价推荐系统结果,这个方式的特点是:可比较、可复现、无偏。
关键词:效果评价
2. Real-time Recommendation of Streamed Data
作者:Frank Hopfgartner (University of Glasgow, UK), Benjamin Kille (TU Berlin, Germany), Tobias Heintz (plista GmbH, Germany) and Roberto Turrin (ContentWise, Italy)
主题:基于流式数据的实时推荐系统如何离线评价?如何做AB对照试验?本文讨论了这两个问题。
关键词:实时推荐,效果评价,ABtest
3. Scalable Recommender Systems: Where Machine Learning Meets Search!
作者:Joaquin A. Delgado (Verizon, US) and Diana Hu (Verizon, US)
主题:典型的搜索和推荐都有两个阶段,召回和排序。所以整合了机器学习的搜索引擎也可以用于推荐系统,本文介绍了一个开源框架,ML-Score,一个深度整合ElasticSearch的插件,用于替换ES默认的排序机制,而代之以机器学习排序,模型可以用Spark Weka R训练得到。
关键词:搜索引擎,ElasticSearch
4. Interactive Recommender Systems
作者:Harald Steck (Netflix Inc., US), Roelof van Zwol (Netflix Inc., US) and Chris Johnson (Spotify Inc., US)
主题:有一种推荐系统,介于主动搜索和被动推送之间,就是交互式推荐系统,它的特点是用户不断对推送结果给予明确反馈,从而引导推荐系统朝自己希望的方向推荐结果。这是一个EE平衡的问题。本文针对音乐推荐(Spotify)和视频推荐(Netflix),根据用户研究和AB对照试验结果,讨论这种推荐系统的方方面面。
关键词:Explore&Exploit问题,交互式推荐
2016
1. Lessons Learned from Building Real-Life Recommender Systems
作者:Xavier Amatriain (Quora, USA) and Deepak Agarwal (LinkedIn, USA)
主题:本文是Quora的工程副总裁根据自己在Netflix和Quora的实践总结出来的十条经验。
关键词:工业级
2. Matrix and Tensor Decomposition in Recommender Systems
作者:Panagiotis Symeonidis (Aristotle University, Greece)
主题:推荐系统中有很多矩阵分解方法,本文用一个统一的例子带你逐一分析这些矩阵分解方法。
关键词:降维,矩阵分解
3. People Recommendation
作者:Ido Guy (Yahoo Research, Israel) and Luiz Pizzato (Commonwealth Bank of Australia, Australia)
主题:本文介绍了社交网络中最常见的推荐系统“可能感兴趣的人”“你可能想关注”。
关键词:社交网络
4. Group Recommender Systems
作者:Ludovico Boratto (University of Cagliari, Italy)
主题:通常推荐系统都是针对单个用户的,那么针对一个群体的推荐系统该怎么做呢?有哪些不同?该如何评价?本文讨论的就是针对群体的推荐系统。
关键词:群推荐
2017
1. Privacy for Recommender Systems
作者:Bart Knijnenburg (Clemson University, USA) and Shlomo Berkovsky (CSIRO, Australia)
主题:推荐系统对数据是贪婪的,但是用户隐私保护也很重要。如何保护隐私,本文从架构、算法、策略相关、UI设计等角度探讨了这一话题。
关键词:用户隐私
2. New Paths in Music Recommender Systems Research
作者: Markus Schedl (Johannes Kepler University Linz, Austria), Peter Knees (Vienna University of Technology, Austria) and Fabien Gouyon (Pandora Inc., USA)
主题:音乐推荐早已经不再是简单的内容推荐或者协同推荐能满足得了听众的了,如今在线音乐推荐的是一种收听体验。简单说就是一种序列推荐,情境推荐,而不简单是某一首歌推荐得“精准”。本文介绍了学术界和工业界对现在音乐推荐提出的解决方案,主要包括:播单生成,情境推荐,音乐制作时的推荐。
关键词:音乐推荐,工业级
3. Deep Learning for Recommender Systems
作者:Alexandros Karatzoglou (Telefonica Research, Spain) and Balázs Hidasi (Gravity R&D, Hungary)
主题:本文介绍了深度学习在推荐系统的应用,如RNN,CNN;使用了深度学习的基于内容推荐和协同推荐是什么样的。
关键词:深度学习
4. Product Recommendations Enhanced with Reviews
作者:Muthusamy Chelliah (Flipkart, India) and Sudeshna Sarkar (IIT Kharagpur, India)
主题:电商中用户评价用于推荐系统非常常见,本文介绍了电商推荐系统中对用户评价的使用,涉及到文本挖掘,情感分析,话题模型,词向量学习。
关键词:NLP
5. Open Source Tools for Online Learning Recommenders
作者: Róbert Pálovics (Hungarian Academy of Sciences, Hungary), Domokos Kelen (Hungarian Academy of Sciences, Hungary) and András A. Benczúr (Hungarian Academy of Sciences, Hungary)
主题:如今的推荐系统早已经不再是周期性计算出推荐结果后再呈现给用户的时代了,在线学习,实时或者准实时捕捉用户的反馈非常必要。但是相应的工程门槛也不低,本文手把手教你如何利用开源工具搭建在线学习系统用于实时推荐系统中。
关键词:实时推荐
话题变迁分析
常规话题
历时十年,有几个话题是一直都存在的:
1. 健壮性及推荐系统安全问题
2. 从学术到工业级别的推荐系统的跨越问题
3. 推荐系统的效果评估问题
4. 如何使用更多的数据以及用户隐私的权衡问题
5. 用户建模
产品应用
下面这些产品是Resys中最常聊到的推荐系统落地场景:
1. 在线视频
2. 社交网络
3. 在线音乐
4. 电商网站
算法和技术
在这十年里,真正落地到工业界产生效果的算法和技术基本上围绕下面这些方向:
1. 协同过滤
2. 矩阵分解
3. 深度学习
4. NLP
后记
ACM的推荐系统专场这十年汇集了全球顶级的Resyser,他们把各自在工作中研究中碰到的问题,得到的经验毫无保留分享出来,非常值得尊敬和感谢。
但另一方面,我们要在自己的应用中落地实践这些又不是那么简单,中间存在一定的鸿沟需要跨过,毕竟路要一步一步走出来。
希望大家能在自己的产品中“大吉大利,每天吃鸡”。
作者简介
刑无刀(本名陈开江),现为链家网资深算法专家,从事算法类产品的研发。曾任新浪微博资深算法工程师,考拉 FM 算法主管。
这里推荐一个作者刑无刀同学的专栏——《推荐系统36式》,为你系统讲解如何从0到1实现推荐系统, 扫码微信订阅
专栏课程介绍
很多同学一看到推荐系统的各种算法,再加上机器学习等高大上的名词,就怵得慌。其实刑无刀也是这么一路过来的,现在再回过去看推荐系统,其实并没有那么复杂。《推荐系统三十六式》中,刑无刀用通俗易懂、多举例少谈概念的方式帮大家讲清楚各个概念。订阅专栏后可以随时给作者留言,刑无刀会回复和解释,也会组织专门的直播来答疑,制作知识图谱总结和整理知识学习路径。
专栏共36期,仅58元,一次订阅,永久阅读。下面是课程的目录,篇篇干货,深入浅出。
订阅方式:
方法一
长按识别下图二维码,微信支付,即刻订阅。
方法二
点击阅读原文,下载“极客时间”App, 。
从首页轮播图或专栏页进入《推荐系统36式》,完成订阅。