BAT机器学习面试1000题(511~515题)

2018 年 10 月 11 日 七月在线实验室

点击上方     蓝字关注七月在线实验室




BAT机器学习面试1000题(511~515题)


511题

对于k折交叉验证, 以下对k的说法正确的是()


A、k越大, 不一定越好, 选择大的k会加大评估时间


B、选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集)


C、在选择k时, 要最小化数据集之间的方差


D、以上所有



点击下方空白区域查看答案

正确答案是:D


解析:

k越大, bias越小, 训练时间越长. 在训练时, 也要考虑数据集间方差差别不大的原则. 比如, 对于二类分类问题, 使用2-折交叉验证, 如果测试集里的数据都是A类的, 而训练集中数据都是B类的, 显然, 测试效果会很差. 


如果不明白bias和variance的概念, 务必参考下面链接:Gentle Introduction to the Bias-Variance Trade-Off in Machine Learninghttp://machinelearningmastery.com/gentle-introduction-to-the-bias-variance-trade-off-in-machine-learning/Understanding the Bias-Variance Tradeoffhttp://scott.fortmann-roe.com/docs/BiasVariance.html




512题

回归模型中存在多重共线性, 你如何解决这个问题?


1 去除这两个共线性变量 

2 我们可以先去除一个共线性变量 

3 计算VIF(方差膨胀因子), 采取相应措施 

4 为了避免损失信息, 我们可以使用一些正则化方法, 比如, 岭回归和lasso回归


A、1


B、2


C、2和3


D、2, 3和4



点击下方空白区域查看答案

正确答案是:D


解析:

解决多重公线性, 可以使用相关矩阵去去除相关性高于75%的变量 (有主观成分). 也可以VIF, 如果VIF值<=4说明相关性不是很高, VIF值>=10说明相关性较高. 


我们也可以用 岭回归和lasso回归的带有惩罚正则项的方法. 我们也可以在一些变量上加随机噪声, 使得变量之间变得不同, 但是这个方法要小心使用, 可能会影响预测效果。




513题

模型的高bias是什么意思, 我们如何降低它 ?


A、在特征空间中减少特征


B、在特征空间中增加特征


C、增加数据点


D、B和C


E、以上所有



点击下方空白区域查看答案

正确答案是: B


解析:

bias太高说明模型太简单了, 数据维数不够, 无法准确预测数据, 所以, 升维吧 !





514题

训练决策树模型, 属性节点的分裂, 具有最大信息增益的图是下图的哪一个()


A、Outlook


B、Humidity


C、Windy


D、Temperature



点击下方空白区域查看答案

正确答案是:A


解析:

A信息增益, 增加平均子集纯度, 详细研究, 请戳看相关论文:A Complete Tutorial on Tree Based Modeling from Scratch (in R & Python)Lecture 4 Decision Trees (2): Entropy, Information Gain, Gain Ratio





515题

对于信息增益, 决策树分裂节点, 下面说法正确的是()


1 纯度高的节点需要更多的信息去区分 

2 信息增益可以用”1比特-熵”获得 

3 如果选择一个属性具有许多归类值, 那么这个信息增益是有偏差的


A、1


B、2


C、2和3


D、所有以上



点击下方空白区域查看答案

正确答案是:C


解析:

C详细研究, 请看相关论文:A Complete Tutorial on Tree Based Modeling from Scratch (in R & Python)Lecture 4 Decision Trees (2): Entropy, Information Gain, Gain Ratio




题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习



今日推荐


我们的【深度学习集训营第二期】火热报名中。从TensorFlow起步实战BAT工业项目。11月13日起正式上课,为期一个多月,努力5周,挑战年薪40万,甚至更多薪!


这么好的机会,还在等什么,报名即送三门课程,《机器学习工程师 第八期》、《深度学习 第三期》、《TensorFlow框架案例实战》,更好的助力您学习深度学习集训营课程。且2人及2人以上组团报名,可各减500元,想组团者请加微信客服:julyedukefu_02


挑战高薪,从现在开始~


 更多资讯

 请戳一戳

往期推荐

【Github 6K星】BAT头条滴滴小米等名企AI工程师笔经面经 + 算法/机器学习/深度学习/NLP资源汇总

一图概览整个深度学习的核心知识体系(建议收藏)

起薪30万,你还在愁找不到工作?

11个 AI 和机器学习模型的开源框架,做项目一定用的上!

作为一个开发,我犯过的错……

机器学习实践难?这10个小秘诀必须知道!

拼团,咨询,查看课程,请点击 【阅读原文

↓↓↓ 
登录查看更多
2

相关内容

【干货书】机器学习Python实战教程,366页pdf
专知会员服务
342+阅读 · 2020年3月17日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
130+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
358+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
165+阅读 · 2019年12月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT机器学习面试题及解析(266-270题)
七月在线实验室
6+阅读 · 2017年12月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第51~55题)
七月在线实验室
10+阅读 · 2017年10月8日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
6+阅读 · 2018年4月23日
Arxiv
9+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年3月22日
VIP会员
相关VIP内容
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
342+阅读 · 2020年3月17日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
130+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
358+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
165+阅读 · 2019年12月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
相关资讯
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT机器学习面试题及解析(266-270题)
七月在线实验室
6+阅读 · 2017年12月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第51~55题)
七月在线实验室
10+阅读 · 2017年10月8日
相关论文
Arxiv
6+阅读 · 2018年4月24日
Arxiv
6+阅读 · 2018年4月23日
Arxiv
9+阅读 · 2018年3月23日
Arxiv
7+阅读 · 2018年3月22日
Top
微信扫码咨询专知VIP会员