BAT机器学习面试题1000题（386~390题）

会员服务 ·

BAT机器学习面试题1000题（386~390题）

2018 年 8 月 29 日 七月在线实验室

点击上方蓝字关注

BAT机器学习面试题1000题（386~390题）

386题

数据不平衡问题

点击下方空白区域查看答案
▼

解析：

这主要是由于数据分布不平衡造成的。解决方法如下：

采样，对小样本加噪声采样，对大样本进行下采样

数据生成，利用已知样本生成新的样本

进行特殊的加权，如在Adaboost中或者SVM中

采用对不平衡数据集不敏感的算法

改变评价标准：用AUC/ROC来进行评价采用Bagging/Boosting/ensemble等方法在设计模型的时候考虑数据的先验分布

387题

特征比数据量还大时，选择什么样的分类器？

点击下方空白区域查看答案
▼

解析：

线性分类器，因为维度高的时候，数据一般在维度空间里面会比较稀疏，很有可能线性可分。

来源：

http://blog.sina.com.cn/s/blog_178bcad000102x70r.html

388题

常见的分类算法有哪些？

点击下方空白区域查看答案
▼

解析：

SVM、神经网络、随机森林、逻辑回归、KNN、贝叶斯

389题

常见的监督学习算法有哪些？

点击下方空白区域查看答案
▼

解析：

感知机、svm、人工神经网络、决策树、逻辑回归

390题

说说常见的优化算法及其优缺点？

点击下方空白区域查看答案
▼

解析：

温馨提示：在回答面试官的问题的时候，往往将问题往大的方面去回答，这样不会陷于小的技术上死磕，最后很容易把自己嗑死了。

简言之

1）随机梯度下降优点：可以一定程度上解决局部最优解的问题缺点：收敛速度较慢

2）批量梯度下降优点：容易陷入局部最优解缺点：收敛速度较快

3）mini_batch梯度下降综合随机梯度下降和批量梯度下降的优缺点，提取的一个中和的方法。4）牛顿法牛顿法在迭代的时候，需要计算Hessian矩阵，当维度较高的时候，计算 Hessian矩阵比较困难。

5）拟牛顿法拟牛顿法是为了改进牛顿法在迭代过程中，计算Hessian矩阵而提取的算法，它采用的方式是通过逼近Hessian的方式来进行求解。

具体而言从每个batch的数据来区分

梯度下降：每次使用全部数据集进行训练

优点：得到的是最优解

缺点：运行速度慢，内存可能不够

随机梯度下降：每次使用一个数据进行训练

优点：训练速度快，无内存问题

缺点：容易震荡，可能达不到最优解

Mini-batch梯度下降

优点：训练速度快，无内存问题，震荡较少

缺点：可能达不到最优解

从优化方法上来分：

随机梯度下降（SGD）

缺点选择合适的learningrate比较难对于所有的参数使用同样的learning rate容易收敛到局部最优可能困在saddle pointSGD+Momentum

优点：积累动量，加速训练局部极值附近震荡时，由于动量，跳出陷阱梯度方向发生变化时，动量缓解动荡。

Nesterov Mementum与Mementum类似，

优点：避免前进太快提高灵敏度

AdaGrad

优点：控制学习率，每一个分量有各自不同的学习率适合稀疏数据

缺点依赖一个全局学习率学习率设置太大，其影响过于敏感后期，调整学习率的分母积累的太大，导致学习率很低，提前结束训练。RMSProp

优点：解决了后期提前结束的问题。

缺点：依然依赖全局学习率

Adam

Adagrad和RMSProp的合体

优点：结合了Adagrad善于处理稀疏梯度和RMSprop善于处理非平稳目标的优点为不同的参数计算不同的自适应学习率也适用于大多非凸优化 -适用于大数据集和高维空间

牛顿法

牛顿法在迭代的时候，需要计算Hessian矩阵，当维度较高的时候，计算 Hessian矩阵比较困难拟牛顿法

拟牛顿法是为了改进牛顿法在迭代过程中，计算Hessian矩阵而提取的算法，它采用的方式是通过逼近Hessian的方式来进行求解。

题目来源：七月在线官网（https://www.julyedu.com/）——面试题库——面试大题——机器学习

分享一哈

分享完机器学习面试题

再和大家分享一哈

我们的

【计算机视觉第二期】

正在火热报名中喔

还没报名的小伙伴们

抓紧时间喽

2人及2人以上组团

立减100元

想组团者可以添加客服：

julyedukefu_02

让客服帮忙组团享受优惠喔

点击下方“阅读原文”

可在线报名

更多资讯

请戳一戳

往期推荐

大数据告诉你：“滴滴们”到底有多不安全

kaggle大杀器之十大深度学习技巧，你了解多少？

数学不好，怎么办？这6大数学技能，AI “必备”

想做Python开发，这14种常用Python模块，你必须知道！

深度学习难吗？如果你连这25个概念都不知道，当然难！

这10道题会做，年薪百万木问题

45万AI面经 | 面试offer拿不停，人称“offer收割机”

【干货合集】关于支持向量机（SVM）的原理，你了解多少？（万字长文速收）

点击“阅读原文”，可在线报名

登录查看更多

相关内容

牛顿法

关注 0

在数值分析中，牛顿方法，也被称为牛顿-拉夫森方法，是一种求根的算法，它对实值函数的根(或零)产生连续更好的逼近.

专知会员服务

170+阅读 · 2020年5月10日

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

专知会员服务

117+阅读 · 2020年3月25日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

130+阅读 · 2020年3月15日

机器学习速查手册，135页pdf

专知会员服务

342+阅读 · 2020年3月15日

【斯坦福大学】Dropout的隐性和显性正则化效应，Regularization Effects

专知会员服务

34+阅读 · 2020年3月4日

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

谷歌机器学习速成课程中文版pdf

专知会员服务

147+阅读 · 2019年12月4日

【机器学习课程】Google机器学习速成课程

专知会员服务

169+阅读 · 2019年12月2日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

BAT机器学习面试1000题（721~725题）

七月在线实验室

11+阅读 · 2018年12月18日

BAT机器学习面试1000题（716~720题）

七月在线实验室

19+阅读 · 2018年12月17日

BAT机器学习面试题1000题（376~380题）

七月在线实验室

9+阅读 · 2018年8月27日

BAT机器学习面试题1000题（331~335题）

七月在线实验室

12+阅读 · 2018年8月13日

BAT机器学习面试题1000题（316~320题）

七月在线实验室

14+阅读 · 2018年1月18日

BAT题库 | 机器学习面试1000题系列（第196~200题）

七月在线实验室

17+阅读 · 2017年11月16日

BAT题库 | 机器学习面试1000题系列（第191~195题）

七月在线实验室

6+阅读 · 2017年11月15日

BAT题库 | 机器学习面试1000题系列（第161~165题）

七月在线实验室

7+阅读 · 2017年11月6日

BAT机器学习面试1000题系列（第116~120题）

七月在线实验室

16+阅读 · 2017年10月24日

BAT机器学习面试1000题系列（第76~80题）

七月在线实验室

5+阅读 · 2017年10月13日

Reasoning on Knowledge Graphs with Debate Dynamics

Arxiv

14+阅读 · 2020年1月2日

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

A Survey on Edge Computing Systems and Tools

Arxiv

35+阅读 · 2019年11月7日

GREASE: A Generative Model for Relevance Search over Knowledge Graphs

Arxiv

4+阅读 · 2019年10月11日

Knowledge-aware Graph Neural Networks with Label Smoothness Regularization for Recommendation

Arxiv

11+阅读 · 2019年6月13日

Adversarial Transfer Learning

Arxiv

12+阅读 · 2018年12月6日

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

Wasserstein Auto-Encoders

Arxiv

7+阅读 · 2018年3月12日

Application of Rényi and Tsallis Entropies to Topic Modeling Optimization

Arxiv

6+阅读 · 2018年2月28日

VIP会员