十面九成,非科班小硕的算法进击之路

2020 年 6 月 11 日 机器学习与推荐算法

前言

结束秋招已经很长一段时间了,如今也已经入职,应大佬邀请整理一下面经,回馈一下有志于从事算法工作的学弟学妹们,毕竟自己也是曾经站在巨人的肩膀上,得到一些帮助,受益匪浅。

笔者背景,C9硕,非科班,互联网领域公司投递的岗位主要是“机器学习”(数据挖掘、搜索广告推荐方向,偶尔也投递一下nlp方向,cv也懂一些),教育和金融领域的公司也投了几家(分别是竞赛教练和量化研究岗)。

因为秋招19年开始地特别早,所以投递的时间比较早,而且规划和定位比较明确(地点不想去的尽量不投(例如北京))。秋招一共面了14家左右大厂(只投递杭州、上海、深圳岗位),放弃了几家外企的面试。

「几点建议」

  1. 多出去看看走走,能收获很多不一样的东西。
  2. 遇事不慌,戒骄戒躁。
  3. 注重积累,持续学习。
  4. 很多时候认真就输了,但不认真也就真的输了。
  5. 学会鼓励与成就他人。
  6. 常怀敬畏之心,敬畏一切。

阿里(杭州)

一面(60min)

  • XGBoost和Lightgbm的优化点,与传统GDBT的区别与联系?
  • 为什么二阶泰勒展开?为什么梯度下降地更快更准?
  • 展开有没有效果的损失?
  • LSTM和GRU原理,与RNN的区别与联系?
  • LR与SVM的区别与联系?
  • 生成模型与判别模型的区别?
  • 牛顿法与梯度下降法的区别?
  • 了解过哪些评估指标?
  • L1、L2正则化区别,为什么可以用在特征选择上?
  • 亿级数组中找TopK
  • 其他就是比赛介绍,面试官自己做过类似的比赛,所以比较感兴趣。
  • 数据清洗、特征工程、模型、模型融合

二面(45min)

  • 简单地介绍下LR?
  • 类别不平衡有哪些解决方法?
  • 展开有没有效果的损失?
  • 介绍下常用的几种聚类方法?区别与联系?
  • 硬间隔与软间隔的区别?
  • 参数模型与非参数模型的区别?
  • 了解提升方法吗?介绍下最基础的AdaBoost以及提升树?
  • 了解过哪些embedding技术?
  • word2vec中两种方法的区别与联系?
  • 二叉树路径总和,找出所有路径
  • 再是比赛和项目介绍,聊业务聊了很久。

交叉面(30min)

  • 说说EM与Kmeans的区别与联系?
  • 多类别不平衡可以怎么解决?
  • XGBoost和Lightgbm与传统GDBT的区别与联系?
  • 有哪些主流的优化方法?
  • kmeans如何确定类的数量?如何优化计算效率?
  • SVM效果一定比LR好吗?
  • Softmax与Negative Sampling的区别与联系?
  • 过拟合都有哪些解决方法?
  • 当今embedding技术有哪些挑战与机遇?
  • 问了一些业务方面的问题该如何去思考设计方案,答得不是很好

腾讯(深圳)

一面(50min)

  • Lightgbm的优化点,与传统GDBT的区别与联系?
  • Xgboost都有哪些改进的地方?
  • Xgboost和Lightbgm的特征和数据的分布式分别是怎么做的?各自存在什么问题?
  • 简单地介绍下SVM?
  • 了解哪些词向量的方法?
  • 决策树都有哪些分裂指标?
  • 把知道的优化方法都说一说?
  • 特征选择都有哪些方法?
  • 了解过Bert,GPT和ELMo之类的模型吗?
  • 问了业务方面的问题,给了两个场景,问如何识别外挂?
  • 其它就是比赛及项目方面的问题。

二面(45min)

  • 简单地介绍下word2vec?说下具体训练过程?
  • gbdt怎么做分类?
  • 卷积神经网络的具体原理?
  • 说说过拟合都有哪些解决方法,越多越好?
  • AdaBoost,random forest和gbdt的区别与联系?
  • word2vec中两种方法的适用场景和优缺点?
  • 简单说说HMM?
  • 了解过多模态?
  • 再是比赛和项目介绍。
  • 给了几个业务场景题,这块一时想不到什么方案,答得一般。

三面(30min)

  • 简单介绍一下word2vec和fasttext?
  • 为什么随机森林比较好?
  • dropout为什么可以防止过拟合?
  • 梯度消失和爆炸都有哪些解决方法?
  • SVM适用于什么样的数据分布?哪种分布它不work?
  • 了解过transformer?讲讲multi-head
  • xgboost,rf和LR的适用场景?
  • 简单说说Bayes?
  • 聊业务,开放题设计方案

百度(上海)

一面(45min)

  • LR与SVM两个算法的适用场景以及它们之间的区别与联系?
  • Boosting和Bagging的区别与联系?
  • rf和gbdt各自优化的是偏差还是方差?
  • 解释一下AUC的计算方法和它代表的意义?
  • L1、L2正则化区别与联系?
  • 快排和归并
  • 其他就是比赛和项目介绍。
  • 数据清洗、特征工程、模型、模型融合

二面(45min)

  • 说说xgboost的分裂指标?xgboost与GBDT的区别?
  • AUC有哪些计算方法?
  • BERT,GPT和ELMo的区别与联系?
  • FM,deepfm原理?
  • 了解哪些graph embedding方法?
  • 注意力机制的原理?
  • BN都有哪些作用?
  • Softmax与Negative Sampling的区别与联系?
  • word2vec中两种方法的区别与联系?
  • 堆排和亿级数组中找中位数。

三面(40min)

  • 聊比赛项目经历,说说遇到的挑战和困难,还有改进的余地吗?
  • 说说在研究生期间的工作,你碰到过最困难的事是什么,以及是怎么解决的?
  • 对各大公司推荐引擎有比较深入的了解吗?
  • 如果给你一个好看视频的场景,你会如何解决?
  • 职业规划相关

华为(杭州)

华为云,直接在六月的时候被叫过去进行顶尖人才专场面试。

一面(40min)

围绕简历,然后问了业务中大数据方面的解决方案有没有想法,中间问了些数据清洗及特征工程方面的问题,还穿插了很多模型压缩与实时流方面的问题,说到时进来做面向芯片的AI加速算法,普及了华为在这方面的前景与优势。

二面(30min)

简历提问,然后介绍华为近些年取得的巨大成就,聊聊业务,人生,价值观以及兴趣爱好。

蘑菇街(杭州)

一面(50min)

  • 自我介绍
  • 梯度消失与梯度爆炸的解决方法?
  • 把知道的优化算法及各自的优缺点都说说看?
  • 围绕项目谈论,一些细节,一些知识(特征工程与模型融合)
  • 特征种类,正则化之类的?参数有哪些?怎么做特征工程,特征选择等
  • 手写代码及测试,斐波那契数列。

二面(35min)

  • 自我介绍
  • EM与kmeans的区别与联系?
  • 说说transformer中multi-head的作用?
  • 说说处理超长文本一般都有哪些方法?
  • lightgbm都有哪些优化的点?
  • 围绕项目谈论
  • 手写代码及测试,二叉树层次遍历。

hr面

  • 工作中优缺点
  • 选择公司的侧重点
  • 自己的offer

字节(上海)

一面(35min)

  • 自我介绍
  • 比赛项目:任务,角色,使用方法,模型,调参
  • 讲讲xgboost?
  • tfidf有哪些优化方法?
  • 实现tfidf;判断链表是否有环

二面(30min)

  • 自我介绍
  • 比赛项目
  • CNN的反向传播细节?
  • 了解Bert和XLNet?
  • 电梯调度(所有人在1楼进电梯,当电梯停在i层时则所有人走出电梯步行到自己所在的楼层中,求所有人爬的楼层数目和的最小值)

网易互娱(杭州)

数据挖掘US

一面(45min)

  • 自我介绍
  • 项目:(比赛+项目)怎么做的
  • lstm解决了rnn的什么问题,为什么会有这个问题?
  • 激活函数都有哪些?
  • relu的问题是什么,怎么解决?
  • 平衡二叉树是什么?
  • 给一个游戏的场景,比如荒野行动,推荐系统应该怎么做?
  • 会使用hadoop和spark这些吗?
  • 说一下业界推荐系统的流程是怎么样的?

二面(30min)

  • 自我介绍
  • 项目:(比赛+项目)
  • 介绍xgboost?
  • bagging和boosting有什么区别?
  • 还是游戏的场景,推荐系统的特征方面应该怎么做?
  • 智力题:一幅地图上已知标签的少数群体,如何才能最快地去获取其它群体的标签。
  • 都有哪些offer,公司一般如何选择?
  • 职业规划

美团北斗(上海)

机器学习方向

一面(45min)

  • 自我介绍
  • 围绕简历比赛问:任务,角色,使用方法,模型,调参
  • 随便说一个算法(说的LR)
  • LR损失函数不能是平方差吗?
  • 优化方法都有哪些?
  • AUC的作用?
  • 如何优化AUC的计算?
  • 智力题:坐飞机问题。

二面(40min)

  • 自我介绍
  • CNN 1*1卷积核的作用?
  • Xgboost和Lightbgm与gbdt的区别与联系?
  • 高维稀疏特征可以怎么处理?
  • 给一个场景题:美团app的猜你喜欢(特征的在线获取和处理)具体方案如何设计,模型只能用LR模型
  • 然后比赛项目:任务,角色,使用方法,模型,调参
  • GBDT怎么做分类?
  • 智力题:一个盒子里面有4个白球和不知道几个红球,扔进一个球(不知颜色),再取出一个,结果是白球,问扔进是白球的概率。

其它一些手撕代码题:

  1. 无序数组找出重复二次的所有数字。
  2. M*N的矩阵,每个格子中都有一个非负整数,只能向右或向下移动,求从左上角到右下角的所有路径中的最大值/最小值。
  3. M*N的矩阵,有无数个点,用最快的速度找到离指定点最近的那个点。
  4. 按一定顺序排列的字母串,随机打乱后的字母串复原回原排列顺序各字母移动次数之和最少为多少。
  5. 买卖股票的最佳时机含手续费。
  6. 大数相乘
  7. 矩形区域不超过K的最大数值和。

暂时能记起来的就这些,还有些ov海康中兴啥的实在太久了,教育和金融公司的面经感兴趣的可以关注我公号(海边的拾遗者)进行交流,先更新这些,祝大家心想事成,多多加油!

END -


推荐阅读

知乎推荐算法工程师面经

技术面试后如何有技巧的向面试官提问?

大厂HR在面试时,都想听你说些啥?

美团机器学习算法岗实习四面面经(推荐系统方向)

喜欢的话点个在看吧👇
登录查看更多
0

相关内容

xgboost的全称是eXtreme Gradient Boosting,它是Gradient Boosting Machine的一个C++实现,并能够自动利用CPU的多线程进行并行,同时在算法上加以改进提高了精度。
最新《高级深度学习》课程, 慕尼黑工业大学
专知会员服务
77+阅读 · 2020年6月20日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【天津大学】知识图谱划分算法研究综述
专知会员服务
106+阅读 · 2020年4月27日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
198+阅读 · 2020年2月11日
面经 | 算法工程师面试题汇总
极市平台
12+阅读 · 2019年10月14日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
今日头条广告算法面经!
算法与数据结构
25+阅读 · 2019年5月29日
爱奇艺深度学习算法实习生面经
算法与数据结构
9+阅读 · 2019年5月28日
备战AI求职季 | 100道机器学习面试题(上)
七月在线实验室
9+阅读 · 2019年3月16日
年薪48万的程序员,他究竟做对了什么?
机器学习算法与Python学习
7+阅读 · 2018年12月28日
这样去面试算法工程师,难怪会凉!
深度学习与NLP
3+阅读 · 2018年11月21日
非科班渣硕的算法工程师进击之路
算法与数据结构
5+阅读 · 2018年9月9日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
8+阅读 · 2018年1月25日
VIP会员
相关VIP内容
最新《高级深度学习》课程, 慕尼黑工业大学
专知会员服务
77+阅读 · 2020年6月20日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【天津大学】知识图谱划分算法研究综述
专知会员服务
106+阅读 · 2020年4月27日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
198+阅读 · 2020年2月11日
相关资讯
面经 | 算法工程师面试题汇总
极市平台
12+阅读 · 2019年10月14日
准备了2个月,终于拿到了推荐算法岗的offer
算法与数据结构
7+阅读 · 2019年5月31日
今日头条广告算法面经!
算法与数据结构
25+阅读 · 2019年5月29日
爱奇艺深度学习算法实习生面经
算法与数据结构
9+阅读 · 2019年5月28日
备战AI求职季 | 100道机器学习面试题(上)
七月在线实验室
9+阅读 · 2019年3月16日
年薪48万的程序员,他究竟做对了什么?
机器学习算法与Python学习
7+阅读 · 2018年12月28日
这样去面试算法工程师,难怪会凉!
深度学习与NLP
3+阅读 · 2018年11月21日
非科班渣硕的算法工程师进击之路
算法与数据结构
5+阅读 · 2018年9月9日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
Top
微信扫码咨询专知VIP会员