BAT机器学习面试题1000题(386~390题)

2018 年 8 月 29 日 七月在线实验室

点击上方蓝字关注




BAT机器学习面试题1000题(386~390题)


386题

数据不平衡问题


点击下方空白区域查看答案

解析:

这主要是由于数据分布不平衡造成的。解决方法如下: 

采样,对小样本加噪声采样,对大样本进行下采样 

数据生成,利用已知样本生成新的样本 

进行特殊的加权,如在Adaboost中或者SVM中 

采用对不平衡数据集不敏感的算法 

改变评价标准:用AUC/ROC来进行评价采用Bagging/Boosting/ensemble等方法在设计模型的时候考虑数据的先验分布



387题

特征比数据量还大时,选择什么样的分类器?


点击下方空白区域查看答案

解析:

线性分类器,因为维度高的时候,数据一般在维度空间里面会比较稀疏,很有可能线性可分。 

来源:

http://blog.sina.com.cn/s/blog_178bcad000102x70r.html




388题

常见的分类算法有哪些?


点击下方空白区域查看答案

解析:

SVM、神经网络、随机森林、逻辑回归、KNN、贝叶斯




389题

常见的监督学习算法有哪些?


点击下方空白区域查看答案

解析:

感知机、svm、人工神经网络、决策树、逻辑回归




390题

说说常见的优化算法及其优缺点?


点击下方空白区域查看答案

解析:

温馨提示:在回答面试官的问题的时候,往往将问题往大的方面去回答,这样不会陷于小的技术上死磕,最后很容易把自己嗑死了。 

简言之

 1)随机梯度下降优点:可以一定程度上解决局部最优解的问题缺点:收敛速度较慢

 2)批量梯度下降优点:容易陷入局部最优解缺点:收敛速度较快 

3)mini_batch梯度下降综合随机梯度下降和批量梯度下降的优缺点,提取的一个中和的方法。4)牛顿法牛顿法在迭代的时候,需要计算Hessian矩阵,当维度较高的时候,计算  Hessian矩阵比较困难。 

5)拟牛顿法拟牛顿法是为了改进牛顿法在迭代过程中,计算Hessian矩阵而提取的算法,它采用的方式是通过逼近Hessian的方式来进行求解。


具体而言从每个batch的数据来区分 

梯度下降:每次使用全部数据集进行训练 

优点:得到的是最优解 

缺点:运行速度慢,内存可能不够 

随机梯度下降:每次使用一个数据进行训练

 优点:训练速度快,无内存问题 

缺点:容易震荡,可能达不到最优解 

Mini-batch梯度下降 

优点:训练速度快,无内存问题,震荡较少 

缺点:可能达不到最优解


从优化方法上来分:

 随机梯度下降(SGD)

 缺点选择合适的learningrate比较难对于所有的参数使用同样的learning rate容易收敛到局部最优可能困在saddle pointSGD+Momentum 

优点:积累动量,加速训练局部极值附近震荡时,由于动量,跳出陷阱梯度方向发生变化时,动量缓解动荡。

 Nesterov Mementum与Mementum类似,

优点:避免前进太快提高灵敏度 

AdaGrad 

优点:控制学习率,每一个分量有各自不同的学习率适合稀疏数据 

缺点依赖一个全局学习率学习率设置太大,其影响过于敏感后期,调整学习率的分母积累的太大,导致学习率很低,提前结束训练。RMSProp 

优点:解决了后期提前结束的问题。 

缺点:依然依赖全局学习率

 Adam 

Adagrad和RMSProp的合体 

优点:结合了Adagrad善于处理稀疏梯度和RMSprop善于处理非平稳目标的优点为不同的参数计算不同的自适应学习率也适用于大多非凸优化 -适用于大数据集和高维空间 

牛顿法 

牛顿法在迭代的时候,需要计算Hessian矩阵,当维度较高的时候,计算 Hessian矩阵比较困难拟牛顿法 

拟牛顿法是为了改进牛顿法在迭代过程中,计算Hessian矩阵而提取的算法,它采用的方式是通过逼近Hessian的方式来进行求解。





题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——面试大题——机器学习



分享一哈

分享完机器学习面试题

再和大家分享一哈

我们的

计算机视觉第二期

正在火热报名中喔

还没报名的小伙伴们

抓紧时间喽

2人及2人以上组团

立减100元

想组团者可以添加客服:

julyedukefu_02

让客服帮忙组团享受优惠喔

点击下方“阅读原文

可在线报名



 更多资讯

 请戳一戳

往期推荐

大数据告诉你:“滴滴们”到底有多不安全

kaggle大杀器之十大深度学习技巧,你了解多少?

数学不好,怎么办?这6大数学技能,AI “必备”

想做Python开发,这14种常用Python模块,你必须知道!

深度学习难吗?如果你连这25个概念都不知道,当然难!

这10道题会做,年薪百万木问题

45万AI面经 |  面试offer拿不停,人称“offer收割机”

【干货合集】关于支持向量机(SVM)的原理,你了解多少?(万字长文 速收)

点击“阅读原文”,可在线报名

登录查看更多
0

相关内容

在数值分析中,牛顿方法,也被称为牛顿-拉夫森方法,是一种求根的算法,它对实值函数的根(或零)产生连续更好的逼近.
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT题库 | 机器学习面试1000题系列(第161~165题)
七月在线实验室
7+阅读 · 2017年11月6日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
Reasoning on Knowledge Graphs with Debate Dynamics
Arxiv
14+阅读 · 2020年1月2日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Arxiv
35+阅读 · 2019年11月7日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
6+阅读 · 2018年3月12日
VIP会员
相关VIP内容
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
356+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
相关资讯
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT题库 | 机器学习面试1000题系列(第161~165题)
七月在线实验室
7+阅读 · 2017年11月6日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
相关论文
Top
微信扫码咨询专知VIP会员