BAT机器学习面试1000题(536~540题)

2018 年 10 月 18 日 七月在线实验室

点击上方     蓝字关注七月在线实验室




BAT机器学习面试1000题(536~540题)


536题

下面的交叉验证方法


i. 有放回的Bootstrap方法 


ii. 留一个测试样本的交叉验证 


iii. 5折交叉验证 


iv. 重复两次的5折教程验证当样本是1000时,下面执行时间的顺序,正确的是


A、i > ii > iii > iv


B、ii > iv > iii > i


C、iv > i > ii > iii


D、ii > iii > iv > i



点击下方空白区域查看答案

正确答案是: B


解析:

答案: B 

Boostrap方法是传统地随机抽样,验证一次的验证方法,只需要训练1次模型,所以时间最少。留一个测试样本的交叉验证,需要n次训练过程(n是样本个数),这里,要训练1000个模型。 

5折交叉验证需要训练5个模型。 

重复2次的5折交叉验证,需要训练10个模型。 

所以B是正确的




537题

变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量选择的考虑?


1.多个变量其实有相同的用处

2. 变量对于模型的解释有多大作用

3. 特征携带的信息 

4. 交叉验证


A、1 和 4


B、1, 2 和 3


C、1,3 和 4


D/以上所有



点击下方空白区域查看答案

正确答案是:C


解析:

答案: C注意, 这题的题眼是考虑模型效率,所以不要考虑选项2.




538题

对于线性回归模型,包括附加变量在内,以下的可能正确的是 :


1.R-Squared 和 Adjusted R-squared都是递增的 


2. R-Squared 是常量的,Adjusted R-squared是递增的 


3. R-Squared 是递减的, Adjusted R-squared 也是递减的 


4. R-Squared 是递减的, Adjusted R-squared是递增的


A、1 和 2


B、1 和 3


C、2 和 4


D、以上都不是



点击下方空白区域查看答案

正确答案是:D


解析:

答案: DR-squared不能决定系数估计和预测偏差,这就是为什么我们要估计残差图。但是,R-squared有R-squared 和 predicted R-squared 所没有的问题。每次你为模型加入预测器,R-squared递增或不变.





539题

对于下面三个模型的训练情况, 下面说法正确的是:




1.第一张图的训练错误与其余两张图相比,是最大的


2. 最后一张图的训练效果最好,因为训练错误最小


3. 第二张图比第一和第三张图鲁棒性更强,是三个里面表现最好的模型 


4. 第三张图相对前两张图过拟合了 


5. 三个图表现一样,因为我们还没有测试数据集


A、1 和 3


B、1 和 3


C、1, 3 和 4


D、5




点击下方空白区域查看答案

正确答案是:C


解析:

答案: C最后一张过拟合, 训练错误最小, 第一张相反, 训练错误就是最大了. 所以1是对的;仅仅训练错误最小往往说明过拟合, 所以2错, 4对;第二张图平衡了拟合和过拟合, 所以3对;





540题

对于线性回归,我们应该有以下哪些假设?


1.找到离群点很重要, 因为线性回归对离群点很敏感

2.线性回归要求所有变量必须符合正态分布

3. 线性回归假设数据没有多重线性相关性


A、1 和 2


B、2 和 3


C、1,2 和 3


D、以上都不是



点击下方空白区域查看答案

正确答案是:D


解析:

答案: D 

第1个假设, 离群点要着重考虑, 第一点是对的 

第2个假设, 正态分布不是必须的. 当然, 如果是正态分布, 训练效果会更好 

3个假设, 有少量的多重线性相关性也是可以的, 但是我们要尽量避免




题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习



七月在线也来找锦鲤啦

还没参加的小伙伴们抓紧时间喽~

我们将在

10月19日下午18:00(明天)

抽出一只锦鲤送出:

1024元现金红包  价值2699元的【2018VIP】

锦鲤可以二选一哦

活动详情戳下面查看:

👇

我们准备了1024元现金

寻找一只爱学习的锦鲤



今日学习推荐


我们的【深度学习集训营第二期】火热报名中。从TensorFlow起步实战BAT工业项目。11月13日起正式上课,为期一个多月,努力5周,挑战年薪40万,甚至更多薪!


这么好的机会,还在等什么,报名即送三门课程,《机器学习工程师 第八期》、《深度学习 第三期》、《TensorFlow框架案例实战》,更好的助力您学习深度学习集训营课程。且2人及2人以上组团报名,可各减500元,想组团者请加微信客服:julyedukefu_02


挑战高薪,从现在开始~


 更多资讯

 请戳一戳

往期推荐

程序员吐槽自己阿里p7面试微软被拒,网友:你就是高级一点的码农

我们准备了1024元现金,寻找一只爱学习的锦鲤!

值得探索的 8 个机器学习 JavaScript 框架

伤不起的三十岁,干不动的程序员要何去何从?

【Github 6K星】BAT头条滴滴小米等名企AI工程师笔经面经 + 算法/机器学习/深度学习/NLP资源汇总

点击【阅读原文】,查看更多

↓↓↓ 
登录查看更多
0

相关内容

交叉验证,有时也称为旋转估计或样本外测试,是用于评估统计结果如何的各种类似模型验证技术中的任何一种分析将概括为一个独立的数据集。它主要用于设置,其目的是预测,和一个想要估计如何准确地一个预测模型在实践中执行。在预测问题中,通常会给模型一个已知数据的数据集,在该数据集上进行训练(训练数据集)以及未知数据(或首次看到的数据)的数据集(根据该数据集测试模型)(称为验证数据集或测试集)。交叉验证的目标是测试模型预测未用于估计数据的新数据的能力,以发现诸如过度拟合或选择偏倚之类的问题,并提供有关如何进行建模的见解。该模型将推广到一个独立的数据集(例如,未知数据集,例如来自实际问题的数据集)。 一轮交叉验证涉及分割一个样品的数据到互补的子集,在一个子集执行所述分析(称为训练集),以及验证在另一子集中的分析(称为验证集合或测试集)。为了减少可变性,在大多数方法中,使用不同的分区执行多轮交叉验证,并将验证结果组合(例如取平均值)在各轮中,以估计模型的预测性能。 总而言之,交叉验证结合了预测中适用性的度量(平均),以得出模型预测性能的更准确估计。
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
40+阅读 · 2020年3月21日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT机器学习面试题及解析(266-270题)
七月在线实验室
6+阅读 · 2017年12月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT题库 | 机器学习面试1000题系列(第161~165题)
七月在线实验室
7+阅读 · 2017年11月6日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
40+阅读 · 2020年3月21日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
相关资讯
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT机器学习面试题及解析(266-270题)
七月在线实验室
6+阅读 · 2017年12月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT题库 | 机器学习面试1000题系列(第161~165题)
七月在线实验室
7+阅读 · 2017年11月6日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
Top
微信扫码咨询专知VIP会员