字节跳动推荐平台技术公开,项亮:底层架构有时比上层算法更重要

2021 年 12 月 3 日 量子位
允中 发自 凹非寺
量子位 报道 | 公众号 QbitAI

字节跳动已正式吹响进军云计算市场号角。

12月2日,火山引擎全系列云产品亮相,共推出了78项云产品服务,涵盖云基础、视频及内容分发、数据中台、开发中台、人工智能等五大类。

火山引擎云产品以性价比、提升业务价值作为重要卖点。发布会上,字节跳动AML(应用机器学习)负责人项亮出现在“新云•智享盛宴”分会场,详细介绍了智能推荐如何结合云服务为企业创造价值,并首次向外界分享了火山引擎智能推荐系统的技术演进和应用实践。

项亮是《推荐系统实践》的作者,其所在的字节跳动AML团队,为火山引擎的智能推荐技术服务提供了全力支持。

以下为项亮演讲全文。

项亮演讲原文

很多人理解推荐就是推荐算法,机器学习模型怎么做的、这些模型怎么调参,觉得这些很重要。其实我想说,推荐系统里底层的工程架构、系统架构非常重要,某种程度上会超过上层的算法。

我们在内部很多实践里也看到,底层工程架构、系统架构如果出现问题,对业务造成的影响是大于算法的。这就是火山引擎为什么要推出推荐系统平台这样一个偏底层架构的产品。

我给大家分三个方面介绍一下智能推荐平台:首先介绍推荐在不同产品、不同业务中究竟发挥什么作用,以及智能推荐平台会给企业带来什么价值;然后我会稍微详细介绍一下平台各个模块大概是做什么的,具有什么能力;最后介绍一些我们客户使用推荐系统的案例。

可以做选择的地方,就可以做推荐

我做推荐系统已经十几年了。很早之前,很多人认为推荐就是锦上添花的工作。但是在今日头条、抖音这些产品的成长中,个性化推荐发挥了重要的作用。推荐也逐渐成为了互联网信息分发的主流模式。

信息分发到现在一共经过了四个阶段,这些阶段一方面有先后顺序,另一方面也不完全是替代关系。比如最早的门户时代,信息分发的方式是分类索引;到了谷歌做搜索引擎,这是基于用户的主动性,通过搜索的方式发现信息;再往后出现了脸书、YouTube,还有国内的微博、微信这些产品,用户基于订阅关注获得信息;然后就是推荐引擎,从“人找信息”变成了“信息找人”。这是在移动互联网时代快速发展起来的,现在已经成为了比较主流的信息分发方式。

所有可以选择的地方,为了解决用户选择困难,基本都可以上推荐系统。比如今日头条,用户看新闻,肯定是适合用推荐的,还有大家熟悉的短视频。分类信息也可以做推荐,信息的分类一般会有很多,手机屏幕再大也是有限的,一屏展示不了多少内容。电商的热门推荐也一样。

说起电商的推荐,商品详情页这个地方,以前最早亚马逊做了打包交叉销售,当用户买了一本书的时候,可以推荐别的书。最开始大家只考虑推荐的商品和当前买的东西是否相关,但现在都会考虑个性化推荐,不仅要和当前商品相关,还要和消费者的兴趣产生关系。

新用户冷启动也已经涉及到推荐。一般有产品会专门做精选页面、热门页面给新用户。虽然是新用户,也可以通过推荐的技术提升效果。像大屏,现在智能电视很普及,我们家已经没有传统电视了,智能电视的节目也是需要推荐的。

另外还有社交、应用市场、音视频、小说的推荐,基本上可以看到,凡是可以做选择的地方都可以做推荐,对效果的影响也很大。

定好目标,剩下的交给机器学习

智能推荐可以帮助客户提升流量活跃度、销售贡献度和效率。但是,搭建整个推荐系统是非常耗费资源的事情。你做推荐系统,肯定要做得更实时,特征回流要快,这些东西都消耗大量的人力成本,试错成本也很大。

企业可以直接在成熟的推荐平台上做推荐系统。字节跳动每天增加1500次AB test,大量的实验可以规避各种错误,现在把推荐系统平台通过火山引擎开放出来,降低大家的试错成本。

火山引擎智能推荐平台,第一个特点是端到端。这个词这些年经常有人提,我估计有些人还不是特别理解。十年前业界的推荐做不到端到端,比如有人买了《射雕英雄传》,就推荐一本和《射雕英雄传》相似的书,基于当时的技术和建模方式,直接就是通过算法工程师自己脑子里的策略实现的。

现在的技术是可以做到直接提升你想提升的业务目标。比如你想实现什么效果,模型可以直接预估这个目标,最终结果按照预估的结果排。先把目标定下来,剩下的都是机器学习的事儿,这就是端到端,这个能力会全流程提供给客户。

第二是实时性,比如消费者购买商品的行为,下次给他推荐的时候,能不能用上刚刚发生的行为,这也很关键。业界开始做实时的推荐系统,可能就是2013、2014左右的时候。据我所知,现在很多企业并没有做到完全的实时,大部分人还是今天训练几个模型,明天就按照今天的模型预估用户的兴趣。我们所有系统都是实时的,特征实时更新、模型实时训练,可以给用户实时的反馈。

再往下就是大规模。我们在内部具备的处理大规模数据的推荐系统、广告系统的能力,对外会同步提供。

然后是行业定制。我们提供了一些行业模板,包括内容、电商等我们有实践的行业。当然有很多行业我们没有做,但是智能推荐平台上会基于我们对外合作中积累的行业经验,给每个行业提供现成的模板,希望大家配置的时候不用配太多东西,就可以快速构建推荐系统。

另外,很多企业都希望自己有研发能力,希望系统不要太黑盒了。我们提供的平台是兼具黑白盒能力的平台,你既可以实现:什么都不管,就把数据接对了,目标定对了,系统就可以做到;你也可以实现:深度开发,比如系统里面调调模型,加加特征,这个也是支持的。

接下来是更加细节的指标,比如模型种类,支持很多种不同的模型。我们对各种模型都做了充分的内部探索,提供出来的是真正有用的。比如多目标,现在推荐系统往往不只是有一个目标,我们提供了多目标的支持。还有很多比较细节的技术。

用好推荐平台,提升的不仅仅是营收

字节内部有很多产品,都是通过推荐中台把产品在底层打通的。比如A产品上有一个方法特别有用,B产品借鉴过去也很快,我们希望把这样的能力同步到对外部客户的服务中。火山引擎的智能推荐平台,就是基于字节推荐中台打造的。

在主要功能上,火山引擎智能推荐平台提供的推荐类型非常丰富,黑白盒功能也介绍过,第三就是校验和归因分析。做推荐,数据是非常关键的,比如给平台的数据是错的,那推荐肯定做不好,往往这一步是很多推荐系统工作中最耗时的部分,所以我们平台会给大家提供校验和归因功能,方便大家把数据做对。另外大家在实际工作中不只是模型,还有各种各样的运营策略,我们也提供这种能力。

最后讲一些客户案例:

一家电商客户,在很多位置接入了信息流的个性化推荐。比如个性化搜索,以前搜索和推荐听起来是两个不同的技术,但是在电商里,搜索结果也需要个性化。火山引擎的智能推荐平台,帮助这家客户在推荐场景中获得人均GMV100%的增长,提升了平台收入和用户体验。

电视现在也非常互联网化了,也可以接推荐系统。比如一些客户关心时长和付费转化率,这是可以通过机器学习模型预估的,也取得了不错的效果,无论是首页的个性化推荐还是频道页推荐、详情页推荐。

此外还有内容社区、广告等案例,最后讲的一个是手机厂商的应用商店,这是我们技术toB做得最早的业务,从几年前就开始做了。客户在使用我们平台过程中,研发团队的能力也得到了提升,从这两条曲线就可以看到,双方效果的差距越来越小。这也说明,智能推荐平台的作用不仅是提升营收,还能够为客户创造更多价值。

希望未来我们有机会为更多客户服务。我的分享就到这里,谢谢大家!

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

2021人工智能年度评选结果揭晓

「2021年度人工智能最具价值创业公司TOP20」榜单中,有垂直领域AI落地实战中的后发先至者,亦有换道超车、在AI发展新赛道中一骑当先的行业开拓者。相同的一点是,它们都在近一年内取得了重大的技术创新和研发成果,受到资本市场热捧、外界舆论瞩目。

AI商业竞争的红海之中,这些公司作为中国AI最具活力的新鲜血液,正以后发优势,开拓出新的蓝海:


p.s.点击图片/链接查看完整榜单:2021人工智能年度评选结果揭晓!AI落地最佳参考在此奉上



点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~


登录查看更多
1

相关内容

推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
王晓伟:图神经网络在快手推荐召回中的应用和挑战
专知会员服务
25+阅读 · 2022年3月23日
【干货书】引擎顺序: 算法技术机制,353页pdf
专知会员服务
42+阅读 · 2021年7月16日
专知会员服务
14+阅读 · 2021年6月26日
专知会员服务
47+阅读 · 2021年5月21日
专知会员服务
189+阅读 · 2021年3月22日
达摩院基于元学习的对话系统
专知会员服务
24+阅读 · 2021年1月1日
专知会员服务
33+阅读 · 2020年11月18日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
字节跳动端到端深度学习召回算法
专知
0+阅读 · 2021年11月11日
互联网平台的“算法”被神化了
人人都是产品经理
0+阅读 · 2021年11月2日
推荐一个CV神器!
图与推荐
0+阅读 · 2021年4月6日
今日头条推荐算法详解(PDF下载)
机器学习算法与Python学习
17+阅读 · 2018年2月27日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
2+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月15日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
Arxiv
11+阅读 · 2018年9月28日
VIP会员
相关VIP内容
王晓伟:图神经网络在快手推荐召回中的应用和挑战
专知会员服务
25+阅读 · 2022年3月23日
【干货书】引擎顺序: 算法技术机制,353页pdf
专知会员服务
42+阅读 · 2021年7月16日
专知会员服务
14+阅读 · 2021年6月26日
专知会员服务
47+阅读 · 2021年5月21日
专知会员服务
189+阅读 · 2021年3月22日
达摩院基于元学习的对话系统
专知会员服务
24+阅读 · 2021年1月1日
专知会员服务
33+阅读 · 2020年11月18日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
相关资讯
字节跳动端到端深度学习召回算法
专知
0+阅读 · 2021年11月11日
互联网平台的“算法”被神化了
人人都是产品经理
0+阅读 · 2021年11月2日
推荐一个CV神器!
图与推荐
0+阅读 · 2021年4月6日
今日头条推荐算法详解(PDF下载)
机器学习算法与Python学习
17+阅读 · 2018年2月27日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员