最近公众号后台收到一个读者的留言,他在某手机厂商做CV开发工作,想转行推荐系统,让我拿拿主意。
从前途角度考虑,我是非常建议的。
大厂必备核心——推荐系统
从商业角度来讲,互联网主要起到平台作用,构建多方沟通桥梁,例如淘宝对应卖家和卖家,头条是信息产出方和读者,除了要满足用户本身的需求,还要考虑到商家的利益。
平台巩固流量,才能进一步的转化,达到盈利。这时候,推荐系统可能是一整个系统的核心。
在算法层面,人力层面,非常需要拥有推荐系统相关知识的人才,这是算法工程师、数据科学家等职业非常好的去处。
同时,推荐算法择业面广,可无障碍转搜索、广告精准投放
因为从模型角度,推荐系统几乎涵盖了所有机器学习能解决问题的结构,并且尝试了各种特征工程方法,构建了很多重要的模型结构。
上游:相关性特征(内容、用户及其匹配信息)、环境特征(时间和地点)、热度特征(热点信息等)和协调特征,从抽象层面,有一些现实的、具体的特征,也有经过特殊化处理和转化的embedding特征。
下游:低维线性的LR、非线性的RF、GBDT,还是更高级的DNN,甚至到目前被广泛使用的wide&deep,知识结构完整和详细,同时这些模型也经受住了实践的检验,例如而很多类似朴素贝叶斯、SVM等可能在学术界很火的模型而且这些模型十分完整,具有很强的借鉴意义。
在过去也从未有过这样的机会——学好推荐算法,一个新人入职就有20~40万年收入:
BOSS直聘2020年四季度人才吸引力报告显示,推荐算法已经连续2年成为平均薪资最高的岗位,平均年薪高达近40W。
但这里存在几个问题,很多欲从事推荐系统的同学大多数学习的方式是自学,缺少企业项目实践
而推荐算法是一个非常贴近业务的工作,业务理解>数据建设度>算法模型。业务中涉及的指标、技术、迭代过程一定要清楚,企业级的项目实践必不可少!
除此之外,协同过滤的itemCF,userCF区别适用场景是哪些?推荐系统的大概步骤,怎么冷启动?协同过滤中的算法怎么细分?
xgb原理推导、fm原理和推导、常见的优化算法、梯度消失/爆炸等,这些问题都不是简单看几篇论文,敲几行代码就能弄清搞懂的。
不解决这些问题,无论面试还是真正去业界做推荐系统,都会被推荐领域的”老鸟“们一眼识别出小白属性。
今天给各位粉丝一个福利,我邀请来我的老朋友smion,他在一线大厂做推荐算法工程师,在实际的业务场景应用这块建树颇深。
关于推荐系统的学习路径以及学习方法,他已经浓缩成了一套学习资料:
前99名粉丝,扫码回复“TJ”
0元观看
👇
(仅今天领取有效,12小时后失效)
从0到1
搞定推荐项目实战
推荐系统应用概述
推荐系统逻辑概述
推荐系统技术架构
经典推荐算法的应用
倒排索引与TF-IDF
基于用户/物品的协同过滤算法
协同过滤与TF-IDF的优化方向
基于隐语义/矩阵分解的推荐算法
基于图模型的推荐算法
基于逻辑斯特回归的推荐算法
poly2特征交叉推荐算法
GBDT/GBDT+LR推荐算法
FM推荐算法
FFM推荐算法
MLR(LS-PLM)推荐算法
经典推荐算法与深度推荐算法的关系
深度推荐算法的进化历程
AutoRec推荐算法
NeuralCF推荐算法
Wide&Deep推荐算法
DeepFM推荐算法
Deep&Cross推荐算法
DeepCrossing推荐算法
FNN推荐算法
PNN推荐算法
NFM推荐算法
AFM推荐算法
DIN推荐算法
DIEN推荐算法
基于多目标学习的推荐算法
基于强化学习的推荐算法
Embedding技术的应用
Word2Vec的CBOW算法及优化
Word2Vec的SkipGram算法及优化
Item2Vec与双塔模型
DeepWalk Embedding生成算法
Line Embedding生成算法
Node2Vec Embedding生成算法
EGES Embedding生成算法
特征工程应用
特征工程的流程常见思路
特征工程典型工程问题
模型与特征实时性
召回与排序的典型策略
算法优化目标的选择
推荐系统冷启动应用与典型问题
冷启动多层级策略
新用户的冷启动策略和算法
新物品的冷启动策略和算法
系统的冷启动策略和算法
贝叶斯参数估计
Thompson采样
UCB算法
Lin-UCB算法
推荐系统的数据流框架
推荐系统的分布式离线训练方法
Parameter Server解析
推荐模型的上线部署方法
tf-Servering的解析
推荐系统的典型离线与线上评估方法与指标计算
A/B实验框架解析
第九章 课程总结
一、基于matrixcf在召回和排序中的运用
业务背景:在电影推荐场景中,当人们没有明确目的,或者说他们目的不明确时,推荐系统需要在海量电影中选择出人们所喜欢或可能喜欢的电影,这个时候需要⼀个强大的智能推荐引擎进行一系列复杂的操作达到实际效果。
落地场景:基于用户的行为数据,运用一定的算法和工程技术,发现用户的隐含兴趣偏好,并进行推荐。
项目难点:数据的处理、模型的工业部署
项目知识点:
(1)原始数据的处理,构建模型能够训练的数据,离散特征,连续特征, 多值特征等各种数据类型如何转换成统⼀的模型输入格式 。
(2)工业推荐框架,召回服务、排序服务、参数服务、特征服务、预估服务
(3)工业的角度进行算法模型的开发,matrixCF模型的开发,matrixCF用于召回的结构,matrixCF⽤于排序的结构
(4)如何进行推荐(模型预估),召回中如何获得召回集,排序中如何获得精排结果
二、电商场景中精排服务的实践
业务背景:电商推荐为用户提供其最有可能产生交互的商品 ( 点击、购买、分享 ),搜索引擎满足用户有明确目的主动查找需求,而推荐系统能够在用户没有明确目的时,帮助他们发现感兴趣的物品。
落地场景:首页推荐、商品详情页推荐、推送页推荐等
项目难点:特征工程、召回、排序、重排
项目知识点:机器学习相关:协同过滤、FM等深度学习相关:DeepFM、PNN、word2vec、bert、多⽬标学习
三、资讯推荐中多路召回的实践
业务背景:基于资讯或者电商业务系统数据,搭建⼀套简单的资讯推荐或者电商推荐系统,为系统增加个性化模块,提升用户的体验及用户停留时长,点击率及转化率。
落地场景:信息流推荐、热⻔流推荐、详情页推荐、点后推荐
项目难点:多路召回的开发流程和召回的部署流程
项目知识点:开发工具:python, redis;算法:als,item2vec,fm, dssm等
四、资讯场景中的混排机制上的业务问题
业务背景:混排的推荐场景中的应用,理解混排的推荐场景中的意义,与具体的业务结合的混排策略在推荐场景中带来的效果,为用户提供个性化模块,提高用户的内容消费及点击率,停留时长
落地场景:首页推荐、商品详情页推荐、推送页推荐等
项目难点:混排的意义和混排的基本策略
项目知识点:python, redis
五、资讯场景中多目标模型的应用
业务背景:资讯场景中通常我们即希望用户点击这个新闻同时也希望用户能喜欢这篇新闻的内容而多看一会,也就是,希望提高点击率的同事能够提高阅读时长,因此,我们需要一个模型既能提高点击率ctr,也能提高时长
落地场景:资讯新闻推荐场景上的首页feed流
项目难点:混排的意义和混排的基本策略
项目知识点:多目标应用场景、多目标模型开发、多目标在资讯场景的业务逻辑
目前互联网大厂的推荐系统框架大同小异。
所有实战项目基于大厂推荐系统必备框架:matrixCF矩阵分解类型的算法所设计,任何推荐场景都可适用
不论是资讯推荐场景还是电商场景,在推荐召回和排序中都可运用,课程所有项目经验都具有可迁移性。
实行小班制点对点教学,每个班级学员不超过20人,充分照顾每个学员的知识掌握程度,根据学习进度,定制学习计划。
助教实时答疑:小班制教学、老师+助教双重保障答疑,全面满足你的求知欲
作业点评辅导:进度汇报+实战技巧+作业讲解+作业发布,想不跟着学都难!
项目汇报:每个项目结束后进行一次项目汇报,输出倒逼输入,更快获得成长
BATJ推荐系统负责人模拟面试场景
√求职行业分析
√简历1对1修改
√面试题互动解答
√招聘岗位推荐
3、可胜任推荐算法工程师
大部分学员毕业后,去往阿里、华为、腾讯、头条、京东等知名互联网企业或研究院,以及中科院计算所、清华、北大、浙大等国内著名高效继续深造。
粉丝福利
我特邀国家级机器学习负责人simon老师,系统教学推荐系统项目课,理论+代码实操,每一个项目都有代码复现,并且代码具有可迁移性,学完就能放到自己的项目使用。
前20名粉丝,扫码回复“TJ”
报名全套项目课
立减1000学费
👇
(仅限今天报名,24小时后失效,需原价购买!)
适合谁学
• 应届生想顺利求职
• 无企业级项目实战经验,面试通过率低
• 0基础小白入行
• 没系统学习过算法原理,想快速上手推荐算法
• 对现有工作感到不合适
• 遇到瓶颈,迫切想转行晋升