BAT机器学习面试1000题(506~510题)

2018 年 10 月 10 日 七月在线实验室

点击上方     蓝字关注七月在线实验室




BAT机器学习面试1000题(506~510题)


506题

一般,k-NN最近邻方法在()的情况下效果较好


A、样本较多但典型性不好


B、样本较少但典型性好


C、样本呈团状分布


D、样本呈链状分布



点击下方空白区域查看答案

正确答案是: B


解析:

K近邻算法主要依靠的是周围的点,因此如果样本过多,那肯定是区分不出来的。因此应当选择B样本呈团状颇有迷惑性,这里应该指的是整个样本都是呈团状分布,这样kNN就发挥不出其求近邻的优势了,整体样本应该具有典型性好,样本较少,比较适宜。




507题

在一个n维的空间中, 最好的检测outlier(离群点)的方法是()


A、作正态分布概率图


B、作盒形图


C、马氏距离


D、作散点图



点击下方空白区域查看答案

正确答案是:C

解析:

马氏距离是基于卡方分布的,度量多元outlier离群点的统计方法。有M个样本向量X1~Xm,协方差矩阵记为S,均值记为向量μ,则其中样本向量X到u的马氏距离表示为:


(协方差矩阵中每个元素是各个矢量元素之间的协方差Cov(X,Y),Cov(X,Y) = E{ [X-E(X)] [Y-E(Y)]},其中E为数学期望)而其中向量Xi与Xj之间的马氏距离定义为:



若协方差矩阵是单位矩阵(各个样本向量之间独立同分布),则公式就成了:


也就是欧氏距离了。  

 若协方差矩阵是对角矩阵,公式变成了标准化欧氏距离。 

(2)马氏距离的优缺点:量纲无关,排除变量之间的相关性的干扰。




508题

对数几率回归(logistics regression)和一般回归分析有什么区别?


A、对数几率回归是设计用来预测事件可能性的


B、对数几率回归可以用来度量模型拟合程度


C、对数几率回归可以用来估计回归系数


D、以上所有



点击下方空白区域查看答案

正确答案是:D


解析:

A: 对数几率回归其实是设计用来解决分类问题的 

B: 对数几率回归可以用来检验模型对数据的拟合度 

C: 虽然对数几率回归是用来解决分类问题的,但是模型建立好后,就可以根据独立的特征,估计相关的回归系数。就我认为,这只是估计回归系数,不能直接用来做回归模型。





509题

bootstrap数据是什么意思?(提示:考“bootstrap”和“boosting”区别)


A、有放回地从总共M个特征中抽样m个特征


B、无放回地从总共M个特征中抽样m个特征


C、有放回地从总共N个样本中抽样n个样本


D、无放回地从总共N个样本中抽样n个样本



点击下方空白区域查看答案

正确答案是:C


解析:

boostrap是提鞋自举的意思(武侠小说作者所说的左脚踩右脚腾空而起). 它的过程是对样本(而不是特征)进行有放回的抽样, 抽样次数等同于样本总数. 这个随机抽样过程决定了最终抽样出来的样本, 去除重复之后, 占据原有样本的1/e比例.





510题

“过拟合”只在监督学习中出现,在非监督学习中,没有“过拟合”,这是()


A、对的


B、错的



点击下方空白区域查看答案

正确答案是: B


解析:

我们可以评估无监督学习方法通过无监督学习的指标,如:我们可以评估聚类模型通过调整兰德系数(adjusted rand score)https://en.wikipedia.org/wiki/Rand_index#Adjusted_Rand_index




题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习



今日推荐


我们的【深度学习集训营第二期】火热报名中。从TensorFlow起步实战BAT工业项目。11月13日起正式上课,为期一个多月,努力5周,挑战年薪40万,甚至更多薪!


这么好的机会,还在等什么,报名即送三门课程,《机器学习工程师 第八期》、《深度学习 第三期》、《TensorFlow框架案例实战》,更好的助力您学习深度学习集训营课程。且2人及2人以上组团报名,可各减500元,想组团者请加微信客服:julyedukefu_02


挑战高薪,从现在开始~


 更多资讯

 请戳一戳

往期推荐

一图概览整个深度学习的核心知识体系(建议收藏)

起薪30万,你还在愁找不到工作?

11个 AI 和机器学习模型的开源框架,做项目一定用的上!

作为一个开发,我犯过的错……

机器学习实践难?这10个小秘诀必须知道!

拼团,咨询,查看课程,请点击 【阅读原文

↓↓↓ 
登录查看更多
2

相关内容

马氏距离是P. C.马氏距离(P. C. Mahalanobis)在1936年提出的对点P和分布D之间距离的度量。它是一个多维的概念的泛化测量有多少个标准差以外P D的意思是这个距离是零的意思是如果P是D,并随着P远离意味着沿着每个主成分轴。如果每一个坐标轴都被缩放成单位方差,那么马氏距离对应于变换后空间中的标准欧氏距离。马氏距离因此是无单位和尺度不变的,并考虑到数据集的相关性。
【清华大学】图随机神经网络,Graph Random Neural Networks
专知会员服务
154+阅读 · 2020年5月26日
机器学习速查手册,135页pdf
专知会员服务
338+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
354+阅读 · 2020年2月15日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
24+阅读 · 2019年11月19日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT机器学习面试题及解析(266-270题)
七月在线实验室
6+阅读 · 2017年12月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第36~40题)
七月在线实验室
8+阅读 · 2017年10月3日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
5+阅读 · 2017年11月30日
VIP会员
相关资讯
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT机器学习面试题1000题(316~320题)
七月在线实验室
14+阅读 · 2018年1月18日
BAT机器学习面试题及解析(266-270题)
七月在线实验室
6+阅读 · 2017年12月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第36~40题)
七月在线实验室
8+阅读 · 2017年10月3日
Top
微信扫码咨询专知VIP会员