从零开始构建企业级推荐系统

2020 年 1 月 20 日 AINLP

作者丨gongyouliu
编辑丨zandy
这是作者的第26篇文章,约1.2w字,阅读需60分钟


最近几个月有很多人咨询作者怎么从零开始搭建工业级推荐系统,有做音视频的、有做新闻资讯的、有做在线教育的,不一而足。大家最大的困惑是不知道怎么下手,也不知道用什么算法合适,对为什么做推荐以及对推荐算法价值的预期也没有明确的想法和概念。总之,对产品是否需要搭建一套推荐系统、需要注意什么都比较迷茫,更不知道怎么为产品快速搭建一套有效的、具备商业价值的推荐系统。


基于上面的问题和困惑,作者打算写这篇文章来详细说明从零开始搭建一套企业级推荐系统需要考虑的问题及相应的对策,将搭建推荐系统中涉及到的知识点、关注点、可能存在的问题体系化地进行归类总结,给需要从零开始搭建企业级推荐系统的读者提供一份参考指南,帮助大家系统化、有针对性地思考,让大家尽量少走弯路。


本篇文章作者基于5W3H(why 、who、when、where、what、how、how much、how feel)思考框架,从你的产品需要推荐系统吗、让谁来搭建推荐系统、在产品的什么阶段搭建推荐系统、搭建什么样的推荐系统、怎么搭建推荐系统、关于构建推荐系统的资源投入、对推荐系统价值的预期、从零搭建推荐系统必须做好的三件事、几个具体实用的建议等九个方面来讲解从零开始搭建推荐系统需要考虑的方方面面。希望本文具备一定的实践参考价值,对大家有所帮助。

   

你的产品需要推荐系统吗(why)


在当今的信息爆炸时代,我们每时每刻都在线,每天需要面对各种各样的信息,而很多时候用户的目标也不是很明确的,在这种背景之下,推荐系统的价值就体现出来了。推荐系统的主要目的是帮助人们解决信息过载的问题,推荐算法就是一种信息过滤的方法,通过推荐系统的过滤作用将用户想要的产品或者服务自动、及时地展示给用户。对推荐系统出现的背景更细致的介绍,读者可以参考《 推荐系统介绍 》这篇文章。


在特定场景下,用户的需求是不明确的,这个是普遍存在的现象。一般来说,一个产品需要借助推荐系统来辅助进行内容分发,需要具备如下两个基本条件:一是产品提供的信息/服务足够多,用户没有时间、没有精力将所有信息/服务都查看一遍再选择适合自己的;二是用户规模足够大,如果只有很少用户,那么其实是可以通过专家提供专业建议的方式来提供服务的。

在移动互联网时代满足这两个条件的产品是非常多的,如我们常见的新闻资讯类、视频类、电商类、音乐类、生活服务类、在线学习类、匿名交友类APP都有推荐系统的用武之地。一句话来概括,如果你的产品是面向C端用户提供海量信息/服务的,那就有做推荐的必要了。


相比于人工编排推荐,推荐系统最大的优势是千人千面、完全自动化、每天可以多次更新甚至实时更新推荐结果。因此,推荐系统具备更高的内容运营效率、更容易击中用户的兴趣点,从而提升用户使用体验,促进用户点击、购买的转化,进而产生商业价值。

基于推荐系统的上述价值,只要产品满足构建推荐系统的条件,作者是强烈建议在产品中引入推荐系统的。


当然,你的产品需不需要、能不能引入推荐系统还跟创始人的视野、格局、思路有很大关系,是否相信推荐技术可以更好地处理信息过滤问题、是否相信推荐系统能够产生极大的商业价值决定了推荐系统在他心目中的地位,进而决定了他是否愿意投入足够的资源来打造推荐系统。 今日头条的张一鸣就是将推荐系统当做公司的核心竞争力,一切业务的发展都围绕个性化推荐来展开,这才让今日头条在短短几年时间内快速成长,市值达到近750亿美元,成为可以震撼BAT三巨头的挑战者。


 让谁来搭建推荐系统(who)


随着大数据、云计算和AI技术的发展,目前有很多云服务厂商(如阿里云、百度云等)和一些做toB生意的AI创业公司(如神策数据等)都提供了推荐系统的SAAS或者PAAS服务。部分传统的外包公司在大数据与人工智能大背景下,也拓展了业务范围,开始提供搭建推荐系统方面的外包服务。因此,我们构建推荐系统就有三种主要方法:


1
自建推荐系统

自建推荐系统最大的优势是整个系统的建设掌握在自己手上,可控性好,方便业务调整和快速迭代,另外算法可以更贴合自己产品的特质做定制化开发,部分开发资源也可以跟后端团队共享。自建最大的问题是需要自己公司招聘推荐系统相关专业人员,因此有更多的固定人力成本。目前对推荐系统比较精通的人才是非常少的,价格也相对很高,小的创业公司也很难吸引优秀的人才,因此组建推荐团队难度高。


2
通过外包构建推荐系统

将公司推荐业务范围和目标定义好,外包给第三方团队来开发是另外一个可行的方案。这种方案的优点是相对轻资产,不需要自己搭建团队。但是最大的问题是,第三方可能对你的业务不熟悉,理解不够深刻,责任心也没那么强,无法做出非常贴合业务及产品特色的推荐系统。外包代码一般注释少,代码结构不清晰,因此后续的维护、迭代等等也是大问题。更大的问题是,外包团队离职率高,等你的系统需要优化了,可能对接的是另外一批人,这批人根本不熟悉原来的系统,怎么能优化得好呢?


3
购买推荐系统云服务

利用第三方云服务公司或者toB的AI创业公司提供的成熟的推荐服务也是一个不错的选择。该方案最大的优势是接入流程相对完善、标准化,可以快速构建一套可用的推荐服务。云服务最大的问题是采用的推荐算法是行业通用的解决方案,模型、数据无法完美匹配自己公司的业务,而我们只能适配云服务厂商提供的规范,比较死板,因此算法效果也不一定有他们鼓吹的那么好。云计算一般提供标准化服务,因此,很难、甚至无法对推荐系统进行个性化的调整和裁剪。有些toB创业公司提供PAAS的私有化部署,甚至将代码给你,可以进行二次开发。这种方式可控性会更好,也可以在代码基础上进行微调,更好适应公司当前业务。由于要在原来的框架下进行修改或者调整,因此修改和调整是有限的。另外,对第三方框架的熟悉度不高,二次开发难度也比较大,做不到自建那样的灵活性。云服务厂商提供的产品和服务如果出现问题,需要提工单,反馈可能不会及时,特别对于创业公司这样的小客户,在云服务厂商那里的优先级是比较低的,响应度自然不会高。


关于怎么搭建推荐系统,下面给出作者的建议。如果公司将推荐系统作为产品的核心功能点,甚至是公司的核心竞争力的话,那么一定要自建推荐系统,这是自己可以完全控制的,核心竞争力一定要掌握在自己手上。如果是期望产品具备推荐的能力,没有将所有希望奇托于推荐系统,推荐只是作为人工运营的一个补充,可以采用云服务的方式。作者最不建议的是外包的方式,风险太大。


到底采用哪种方式,还与公司所处阶段、产品定位、公司发展目标、当前的人力、财力、资源等因素有关,所以需要事先评估清楚再决策,这种决策一定是公司高层的事情,只有老板想清楚了,自上而下达成一致,目标明确,才能做好推荐系统。当然,也不是一种方式一成不变,先采用云服务的方式,等招聘到合适的推荐系统人才或者产品更稳定了再自己搭建也是可行的方案。


 在产品的什么阶段搭建推荐系统(when)


产品的生命周期一般会经历起步期、成长期、成熟期、衰退期、消亡期等五个阶段。一般建议在产品的起步阶段和成长阶段来构建推荐系统,这样可以更早地利用AI技术的红利,发挥推荐算法的优势,提升内容的分发效率,提高用户的参与度和粘性,最终让产品更快地成长、获得更多的用户。


越早想清楚推荐的价值,趁早做,可以尽快验证推荐对产品的贡献,及时决策调整,所谓船小好调头。早做的另一个好处是,可以更好地巩固推荐系统在产品中的主导地位。如果在后期做推荐,整个产品运营体系都很成熟了,很难让推荐在产品中占得一席之地,因为不同模块运营人员之间会存在“权力斗争”,大家互相争夺地盘,抢核心位置的运营权,其结果可能会让推荐系统难以落地,最终变得可有可与,无法发挥应有的价值。


 搭建什么样的推荐系统(what)


推荐系统主要有排行榜推荐、相似推荐、个性化推荐、流式推荐等几种主流的核心产品形态。那么我们的产品应该选择哪几类推荐系统产品形态呢?


一般来说个性化推荐与相似推荐是两类最重要的推荐产品形态,如果你打算在你的产品中引入推荐技术的话,相似推荐和个性化推荐是强烈建议采用的。这是因为这两个推荐形态是用户触点多的路径(所谓用户触点多,就是用户大概率必经的路径),这样用户就可以更方便、更频繁地接触到推荐了,才有机会让推荐系统真正发挥价值。


在产品中位置是非常重要的,要做好推荐,必须放到核心位置(不一定是一开始就放到核心位置,可以通过AB测试评估,当效果足够好了就有资格这样放了)。古语说的“酒香不怕巷子深”这句真理在当今的产品中是不适用的,因为酒是有气味的,不能看到也能闻到,而推荐产品只有用户看到了才知道它的存在。


相似推荐一般部署在详情页中,通过不同的特征维度构建推荐算法,在标的物的详情页中关联一组有相关关系的标的物作为推荐列表。详情页是任何一个标的物都有的,所以是一个非常核心的用户触点多的位置。


而个性化推荐可以安置在首页等核心位置为用户提供个性化的推荐服务(个性化推荐的标的物数量、排放位置是可以根据场景、产品阶段做动态调整的)。个性化推荐可以做成实时推荐的形式,即所谓的信息流推荐,这样可以给用户实时反馈,让用户获得所见即所得的效果,从而提升用户体验,同时让更多的标的物曝光(实时推荐提升了标的物的流转效率,当然会让更多的标的物曝光),这对平台方及标的物提供方都是非常有价值的,实时个性化推荐也是未来的发展趋势。像新闻资讯、短视频等“快消类”产品(用户“消费”完标的物的时间短,这类产品一般会占据用户的碎片化时间)是非常适合做实时个性化推荐的,就连淘宝、天猫的首页也切换到了信息流推荐。首页是用户打开产品就能第一个看的的页面,所以一定是用户触点多的核心位置。


排行榜推荐是一类非个性化推荐,可以根据最新、最热、购买量、播放量等统计维度来构建排行榜,实际计算非常简单。由于人类普遍具有从众效应,排行榜类推荐实际效果还是可以的。即使我们的产品不提供排行榜这类推荐形态,排行榜推荐一般也可以作为个性化推荐的默认推荐(当个性化推荐数量不足时用排行榜填充,或者当个性化推荐接口出问题时,用排行榜推荐替代)。


 怎么搭建推荐系统(how)


从零开始搭建推荐系统,个人建议尽量快速让新的推荐业务上线,再逐步优化,提升算法效果。在如今竞争非常激烈的大环境下,快是第一位的。不要想着一开始就做出一个非常完美的、效果非常好的推荐系统,期望系统一上线就可以大大提升标的物的分发与转化,这种想法是不切实际的。在没有上线之前,我们只能根据离线评估或者个人经验来判断算法是否有效,个人经验判断往往是有误的,另外离线评估效果好的算法在真实业务场景中不一定就能提升商业化指标,也就是说离线评估和在线评估(商业化指标)可能不是正相关的。


对于早期阶段的产品,由于用户很少,数据量不多,计算成本不大,我们甚至可以利用单台服务器、单进程部署一个推荐系统,而不用考虑后面当用户多了之后的分布式计算,这样算法可以先快速上线。当用户足够多,单机算不过来了可以再考虑利用Spark等分布式计算平台重构现有业务逻辑。


下面我们根据产品所在不同阶段来说明搭建什么类型的推荐系统及怎么搭建,给大家提供一份切实可行的参考指南。


1
产品起步阶段的推荐

在产品的起步阶段,由于用户规模小,用户行为数据少,没有足够多的行为数据来训练协同过滤推荐算法,这时比较适合基于内容的推荐算法,该类方法可以有效地缓解冷启动问题。基于内容的推荐算法也是比较简单的一类算法,开发简单、容易部署上线。我们下面根据不同的产品形态来说说怎么搭建基于内容的推荐算法。


(1) 资讯新闻等文本类产品
对于资讯新闻这类主要是文本的产品,最简单的方式是基于TF-IDF模型来构建推荐算法,每个文本(标的物)基于TF-IDF构建向量表示,通过向量的cosine余弦相似度来计算两个文本的相似度。

这种文本相似度可以直接用于构建相关推荐(某个文章最相似的N个文章作为相似推荐列表)。我们可以将用户最近看的文章的向量进行加权(根据观看时间、停留时间等)获得用户的向量表示,用户向量与文章向量的consine余弦就是用户对该文章的喜好度,还可以用item-based协同过滤的计算思路(见下面公式,其中S是所有用户操作过的标的物的列表, 是用户u对标的物 的喜好度, 是标的物 与s的相似度)来计算用户对新文章的评分,最后一种方式是先对文章进行聚类,在推荐时,推荐用户看过的文章所在类别的其他文章作为推荐列表。 

   

     


新闻资讯类文章一般可以做成信息流推荐,基于上面提到的TF-IDF算法也是可以实现实时推荐的。对于新发布的一篇文章,可以基于现有的词库(corpus)来生成该文章的向量表示(如果该新文章中包含某些词,不在corpus中,那么可以直接忽略这些词,虽然这样做精确度有所下降,但是不用对所有文章进行重新求向量化的过程,因此可以做到实时化,向量化的过程可以每天利用所有文章作为document重新运行一次),向量化后这篇新的文章就跟其他文章一样处理了。


(2) 视频类产品

视频类产品,一般可以分为长视频和短视频两大类,它们的内容来源不同、内容生产的频度不一样、用户的消费习惯也不一样,因此我们分长视频和短视频两种情况进行说明。


长视频


长视频一般属于PGC(Professional Generated Content)内容,内容生产周期长、成本大、更专业。内容在创作完成就会包含大量的metadata信息,比如演职员、年代、标签、剧情、类别、语言、地区等等。这时我们可以采用如下两种算法来构建推荐系统:


a  基于标签

如果长视频标签比较完善(PGC内容一般在生产出就会包含一些核心标签的),可以采用标签n-hot编码来(嵌入)表示每个视频,这样就可以计算任意两个视频的相似度了。我们可以采用(1)中类似的方法来做相似推荐和个性化推荐。

另外,根据用户的播放记录,我们可以给用户打上相关的兴趣标签,再采用基于标签的反向倒排索引方法做推荐(读者可以参考《 基于内容的推荐算法 》这篇文章第二节4(5)中的具体算法原理)。


b 基于结构化的metadata信息

如果长视频标签不够丰富或者标签质量不佳,可以利用结构化metadata信息(基于长视频PGC内容属性,这个一定是有的),可以采用向量空间模型来计算两个视频之间的相似度。具体参见《 基于内容的推荐算法 》第二节3(2)中对向量空间模型的介绍,并结合《 基于Erlang语言的视频相似推荐系统 》第二节中的具体实现案例。有了视频相似度,可以采用(1)中类似的方法来做个性化推荐。


短视频


短视频一般属于UGC(User Generated Content)或者PUGC(Professional User Generated Content)内容,内容生产周期短、成本低、内容产量大、内容质量参差不齐。短视频由于产量大、有时效性(如新闻类),一般平台方通过人工构建标签体系是不现实的,但是可以制定一定的标准和规范,辅助一些奖惩措施(制作良好标签,满足规范的内容生产者给予一定的内容曝光优先级,反之,质量差的生产者降低曝光概率),让内容生产者根据规范或者标准来事先定义好标签,在内容上传到平台时附带上传定义好的标签。不过不同的内容生产者由于专业度相差较大、理解上也不一致,可能会导致最终的标签体系质量不够高。基于现在短视频标题一般比较长(一般有10-30字)这一事实,另外一种低成本快速获得标签的方法是基于NLP技术,从标题中提取关键词作为该短视频的标签,在电视猫短视频推荐中我们也部分采用了这种方式生成的标签。如果这些标签都不够完善,那么基于来源渠道、内容分类、上线时间等几个少数标签都可以构建出一套简单的内容推荐系统。有了标签,就可以按照上面讲到的类似方法构建相似推荐和个性化推荐。


短视频一般没有长视频那类丰富的结构化信息,因此采用标签推荐也可能是唯一可行的方式。短视频属于“快消”类的内容,因此最好是打造实时的个性化推荐,具体技术实现案例可以参见《 基于标签的实时短视频推荐系统 》这篇文章的介绍。


(3) 电商类产品

电商类产品相对复杂,会有非常多的品类及类目,这些信息本身属于标签的范畴,不同品类包含的信息也会不一样。比如衣服会有颜色、款式等信息,手机等有重量、尺寸等信息。价格、生产商等共用的metadata信息也是有的。电商类产品一般会在同一品类下计算相似推荐,这时可以用同一品类下的标签、metadata信息采用与上面类似的方法计算相似度。电商的个性化推荐会更加复杂,一般可以基于用户过去的浏览记录及购买记录给用户打上相关的兴趣标签,再采用标签倒排索引的方法进行推荐(读者可以参考《 基于内容的推荐算法 》这篇文章第二节4(5)中的具体算法原理)。

当我们的产品经过一段时间的发展,积累了更多的用户和数据后,对推荐系统的架构、价值、运营方法等有了更深入的了解,我们就进入的成熟产品阶段的推荐。

2
成熟产品阶段的推荐

对于成熟阶段的产品,用户规模会比较大,也有足够多的行为数据,这时可供我们选择的算法会非常多,除了上面介绍的基于内容的推荐算法,常用的协同过滤算法,如item-based协同过滤、矩阵分解、分解机等都是不错的选择,有资源、有条件的公司还可以选择深度学习等更复杂的模型。一般来说,协同过滤算法的效果好于基于内容的推荐算法,建议有条件可以在这一阶段适当采用协同过滤相关算法。具体怎么实施协同过滤算法,可以参考《协同过滤推荐算法》、《矩阵分解推荐算法》、《因子分解机》、《嵌入方法在推荐系统中的应用》以及《深度学习在推荐系统中的应用》这几篇文章。


上面我们只列举了新闻资讯、视频类、电商类的产品在不同阶段怎么做推荐,对于其他产品需要根据产品特性、已有的数据形式等采用类似的策略,这里不再赘述。



 关于构建推荐系统的资源投入(how much)


做任何一件事情都是需要资源投入的,特别是做好一件事情更需要投入足够多的时间和精力,对于构建推荐系统也不例外。在本节我们来讲讲从零开始构工业级建推荐系统需要哪些资源投入,让还没有太多相关经验、但是想了解怎么从零构建推荐系统的读者有一个初步认知,并且作者会基于自己多年经验给出一些建议。


对于推荐系统的资源投入主要有两类,一类是人力投入,一类是计算资源(如服务器)资源。下面分别对这两类投入进行细致分析。


1
人力投入

推荐系统的人力投入主要是从数据收集到推荐算法上线提供推荐服务整个过程中的人力投入。包括日志打点、数据收集、数据存储、特征工程、模型训练、推断预测、前端接口开发、UI交互、产品设计、项目跟踪等等。日志打点、数据收集、数据存储这些可以复用大数据相关技术栈和人力(一般互联网公司都会有相关的大数据分析团队),前端推荐接口开发可以复用后端人力,UI交互、产品设计、项目管理这些也是可以复用的资源(当产品规模足够大,公司会专门招聘算法类产品经理)。所以构建推荐系统最核心的人力资源就是特征工程、模型训练、模型推断预测这几个算法核心工作需要的人力,这也是推荐系统最重要、最有技术含量的部分。如果不是采用外包或者直接利用云厂商的SAAS/PAAS服务的话,是需要相关专业人才进行开发的。那么这个人是内部选拔还是重新招聘呢?下面给出作者的建议。


如果团队人力比较充足,短期内也很难招聘到合适的有经验的推荐开发人员,是可以先借调一些人力通过自学一些相关知识,快速开发一个推荐系统的原型并上线的。不过为了避免走很多弯路,技术负责人是需要全程参与把关的,并且最好能够咨询一些外部有经验的推荐系统专家的建议。如果有条件的话,是可以招聘一个有经验的专业的推荐开发人员来做的,招聘的原则也是希望以前做过或者了解过推荐系统全流程的开发人员,这样可以更好地把握推荐系统建设的方方面面。


2
计算资源投入

构建推荐系统是一个数据密集型、计算密集型工程技术,因此是需要一些软硬件资源来支撑推荐服务的构建的。目前云计算已经非常成熟,这些资源都可以从云平台购买,而不是自己搭建。作者公司是从12年开始做大数据和推荐的,当时国内云计算还不成熟(阿里云09年才成立,12年还没有相关大数据云服务产品),因此自始至终都是自己搭建数据平台与计算中心的,这中间由于人力、资源不足,也没有专门的大数据基础架构资深专家进行较底层的开发与维护,中间遇到很多坑,对整个推荐系统的开发速度和推荐系统的稳定性是有一定的负面影响的,因此作者强烈建议采用购买云服务的形式构建大数据的存储与计算中心。


前面我们也讲过,在产品早期,用户规模相对小,我们没必要构建大数据平台,单机单线程就可以跑出一个推荐系统。当用户足够多、数据量足够大时,再投入资源构建大数据平台。因此,为了节省公司成本,一切资源的投入需要遵从从简原则。


对推荐系统价值的预期(how feel)


我们构建推荐系统,一定是对推荐系统抱有期望的。那么推荐系统对产品、对公司到底有什么价值呢?概括来说推荐系统的价值主要体现在如下4个方面:


1
用户增长方面:提升用户留存、活跃、停留时长


个性化推荐可以做到千人千面、实时推荐用户感兴趣的内容,更容易击中用户的兴趣点,当然可以让用户更好地留存下来,也更容易让用户跟产品互动(在抖音你只要简单滑动,就有源源不断的新视频出现在你面前),增加用户的使用时长,最终也提升了用户体验。


2
经济价值方面:节省人力成本、促进"标的物"变现

节省人力成本应该很好理解,有了个性化推荐,就不需要那么多人工运营的工作,甚至不需要那么多人工运营人员了。这里“标的物”的变现,如果“标的物”中包含广告(如视频的前贴片广告)或者“标的物”就是广告(如信息流广告),那么就是促进广告的曝光与点击,如果标的物包含会员内容(推荐付费的会员视频),那么就是促进会员转化,如果标的物本身就是商品(如淘宝上的各种商品),那么就是促进商品的售卖。


3
效率方面:提升内容分发效率、促进长尾内容分发

推荐系统完全是程序化自动完成内容分发的,可以做到实时、全天候无人管控的推荐,分发效率自然高。推荐系统根据用户的兴趣来分发内容,长尾内容一定有喜欢它的用户,推荐系统可以很好地发挥从“标的物”找人这个逆向功能。头部内容毕竟是少量的,长尾内容才是常态,这无疑让推荐系统发挥了无可比拟的作用。


4
生态方面:促进“标的物”提供方的生态繁荣

这个价值可能不太好理解,如果你的产品是像淘宝这类做平台的,那么借助推荐系统可以将优质商家的优质商品推荐出去,而不好的商家的商品由于质量不行,没有太多的购买量,用户评价也不高,推荐系统的协同效应就会降低它的权重,让这些品质不太好的东西很难被推荐出去。这里推荐算法起到了择优筛选的作用,自然可以促进平台上的商家生态越来越健康。


我们不光要知道推荐系统的价值,更应该提前思考清楚哪些价值是自己产品追求的、哪些是当前阶段最重要的,想清楚了这个问题,我们就需要量化这些维度的价值。我们需要根据产品发展阶段和公司整体运营策略确定核心指标,有了核心指标,我们还要确定具体的KPI或者KR(Key Results,OKR方法中的关键结果)。关于这一块的详细讨论,读者可以参考文章《推荐系统的商业价值》进行深入学习了解。


   

从零搭建推荐系统必须做好的三件事


前面对从零开始搭建一套可行的工业级推荐系统的各个方面进行了介绍,那在搭建推荐系统中什么是最重要的呢?基于作者个人经验,我觉得一个可用的、有商业价值的工业级推荐系统必须需要建设下面3个功能点。


1
算法
算法是推荐系统的核心,好的算法才能够更精准、更有效地将“标的物”分发给喜欢它的用户。所以在开始设计推荐系统时,一定要结合产品当前的阶段、产品具备的数据、现有资源情况等选择一个合适的推荐算法作为构建的第一个算法。


2
评估指标
我们做推荐算法的目的就是要让推荐算法产生效果,那么效果怎么评估呢?不是我们通过思考或者拍脑袋就可以知道的。在精细化运营时代,我们需要用数据说话,对于推荐系统也不例外。因此,我们需要对构建的推荐系统定义一些评估指标(这些评估指标是跟公司的战略、产品当前的目标息息相关的),来评估推荐算法的效果。

常用的评估推荐效果的指标有转化率、人均点击次数、人均播放时长、客单价等等。当然为了统计这些指标,我们需要对用户操作行为进行日志打点,收集用户对推荐标的物的反馈,才能统计出这些指标。

在第七节我们已经对部分指标进行了解读,读者可以参考《 推荐系统的商业价值 》这篇文章了解更多关于推荐系统指标的介绍。


3
AB测试
AB测试是一种对比测试, 比较两种操在某个变量不一样而其他变量都是完全一样的情况下,两种方法的优劣。 通过构建推荐系统的AB测试平台,我们可以让推荐系统的迭代变得有据可依。 刚构建推荐系统时,不需要AB测试建得多么复杂,只要能用就行,这样可以让系统快速跑起来,当业务需求更加复杂时,可以再迭代优化AB测试,让AB测试可以支撑更复杂场景的对比测试。

最简单的AB测试可以根据用户id进行hash,将两种(或者多种)不同的推荐算法的推荐结果分别存于不同的库中,推荐接口通过请求中用户id参数,hash出对应的库,再去相关的库中获取对应的推荐结果,给做AB测试的不同组用户展示不同的推荐结果。读者可以参考《 AB测试平台的工程实现 》这篇文章了解怎么实现AB测试平台。


只有当我们构建了推荐算法,有了评估指标,有了对比测试的工具,我们可以根据算法的效果(由评估指标来衡量)来优化算法,再将新老算法做对比测试,新的更好就用新的,否则再进行优化对比测试,这个过程可以不断进行下去,这样我们就将推荐系统打造成了一个可以进行闭环迭代的业务系统,做到了闭环,我们就可以无限迭代优化下去了。


几个具体实用的建议


前面几节对从零开始搭建推荐系统的各个方面进行了细致介绍,在这一节我们重点讲解几个在搭建推荐系统过程中需要特别关注的点,部分在前面章节已经简单提到了,这里再明确地强调一下。


1.新闻资讯、短视频类产品建议采用基于内容、标签的算法

这类产品,标的物本身产量大、有一定的时效性,物品冷启动问题较严重。采用基于内容标签的算法可以一定程度避免该问题。同时,基于内容标签的推荐算法可解释性好,用户立刻就明白给他这样推荐的原因,用户更容易接受和认可(下面会讲到这类产品一般提供实时推荐,在实时推荐中直观简单的推荐解释是非常容易让用户接受你的推荐策略的)。

对于这类产品,基于内容的推荐方法相对简单,并且有上面提到的一些优点,企业开始搭建个性化推荐系统时可以采用这类方法。


 2.提供“快消”类标的物的产品建议采用流式推荐

“快消”类产品,如短视频、新闻资讯等,用户消费一个标的物的时间很短,用户也更愿意在零散的时间片段使用,因此可以很好地占领用户的碎片化时间。产品只有做到在短时间内给用户提供感兴趣的东西、击中用户中区神经的快感中心,用户才会一直跟产品交互获得更多的短期刺激,否则用户直接退出了。而流式实时推荐可以很好地解决该问题,通过将主动权、控制权部分给予用户,用户通过不断刷的动作来快速地、不间断地寻找自己的兴趣点。


 3.尽量使用简单的推荐算法快速上线,快是核心竞争力

在从零开始构建推荐系统时,最重要的目标是让系统快速上线,尽早跑起来,在使用过程中发现问题,快速迭代、逐步完善。有时简单的算法的效果也不差,相对于复杂的更精准的算法有更高的投入产出比。读者可以参考《 基于朴素ML思想的协同过滤推荐算法 》这篇文章,里面讲到了YouTube、Google News在早些年利用关联规则、naive bayes、聚类三大简单机器学习算法做个性化推荐的技术方案,非常值得我们借鉴。


 4.构建推荐系统业务闭环比什么都重要

企业级推荐系统一定是一个业务系统,最终的目标是为业务服务,在服务好用户、为用户创造价值的同时提升商业价值。因此,我们首先需要量化业务价值,确定业务核心指标,并构建具备快速评估、快速迭代现有推荐系统和算法的能力,这就是我们第八节说的最重要的三件事,只有做到这些,我们才能构建出一个推荐系统的业务闭环,通过不断迭代、不断优化,让推荐系统源源不断地输出价值。


 5.推荐系统专人负责制

企业在开始搭建推荐系统时,最好选定一个人作为整个推荐系统业务的负责人,直接向更高层领导(如CEO)汇报,负责包括推荐算法、工程、推荐产品、推荐运营等所有相关业务,负责整个推荐业务的落地,并对最终结果负责。这个人不光懂推荐算法,更应该有产品思维、有用户思维、有业务意识。

如果推荐各个模块由不同人负责,这些人汇报的对象也不是同一人,这时资源会太分散,无法形成更好的合力,只有有唯一的负责人,决策才更容易执行下去,才能更好地从零开始搭建出推荐系统,让推荐系统走上正轨,尽快产生业务价值。


总结


文作者基于自己多年推荐系统研发的实践经验,通过深入思考,利用5W3H分析法,对从零开始构建一套商业级推荐系统涉及到的方方面面的问题进行了归纳和总结,并提供了作者自己的思考方法和解决方案。

工业级推荐系统的构建需要考虑ROI(Return OInvestment,投入产出比、投资回报率),希望利用最小的资源投入产出最大的价值。因此,在构建推荐系统之前我们需要思考清楚我们的目标,结合我们现有的资源和当前所处的阶段,选择合适的算法和工具来快速构建推荐系统,并通过不断迭代,逐步提升效果,让推荐系统真正产生商业价值!
-end-



本文转载自公众号:大数据与人工智能,作者gongyouliu


推荐阅读


AINLP年度阅读收藏清单


[论文解读]微信看一看实时Look-alike推荐算法


YouTube基于多任务学习的视频排序推荐系统


机器翻译中的强化学习:优点、缺点以及不足


使用Python复现SIGKDD2017的PAMAE算法(并行k-medoids算法)


【Github】BERT-NER-Pytorch:三种不同模式的BERT中文NER实验


征稿启示 | 稿费+GPU算力+星球嘉宾一个都不少


AINLP-DBC GPU 云服务器租用平台建立,价格足够便宜


AINLP-DBC GPU 使用体验指南


我们建了一个免费的知识星球:AINLP芝麻街,欢迎来玩,期待一个高质量的NLP问答社区


关于AINLP


AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP君微信(id:AINLP2),备注工作/研究方向+加群目的。


登录查看更多
1

相关内容

推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
我的推荐系统入门经验~
大数据技术
39+阅读 · 2019年9月19日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
深度 | 推荐系统如何冷启动?
AI100
17+阅读 · 2019年4月7日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
微软开源项目提供企业级可扩展推荐系统最新实践指南
微软研究院AI头条
4+阅读 · 2019年2月25日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐系统概述
Linux爱好者
20+阅读 · 2018年9月6日
【推荐系统】一文读懂推荐系统知识体系
产业智能官
42+阅读 · 2017年10月31日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
A Survey on Edge Intelligence
Arxiv
50+阅读 · 2020年3月26日
Arxiv
101+阅读 · 2020年3月4日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
3+阅读 · 2018年11月12日
VIP会员
相关资讯
我的推荐系统入门经验~
大数据技术
39+阅读 · 2019年9月19日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
深度 | 推荐系统如何冷启动?
AI100
17+阅读 · 2019年4月7日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
微软开源项目提供企业级可扩展推荐系统最新实践指南
微软研究院AI头条
4+阅读 · 2019年2月25日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐系统概述
Linux爱好者
20+阅读 · 2018年9月6日
【推荐系统】一文读懂推荐系统知识体系
产业智能官
42+阅读 · 2017年10月31日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
相关论文
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
A Survey on Edge Intelligence
Arxiv
50+阅读 · 2020年3月26日
Arxiv
101+阅读 · 2020年3月4日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
3+阅读 · 2018年11月12日
Top
微信扫码咨询专知VIP会员