BAT机器学习面试1000题(476~480题)

2018 年 9 月 26 日 七月在线实验室

点击上方     蓝字关注七月在线实验室




BAT机器学习面试1000题(476~480题)


476题

一监狱人脸识别准入系统用来识别待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求:


A、二分类问题


B、多分类问题


C、层次聚类问题


D、k-中心点聚类问题


E、回归问题


F、结构分析问题



点击下方空白区域查看答案

正确答案是: B


解析:

二分类:每个分类器只能把样本分为两类。监狱里的样本分别为狱警、小偷、送餐员、其他。二分类肯 定行不通。瓦普尼克95年提出来基础的支持向量机就是个二分类的分类器,这个分类器学习过 程就是解一个基于正负二分类推导而来的一个最优规划问题(对偶问题),要解决多分类问题 就要用决策树把二分类的分类器级联,VC维的概念就是说的这事的复杂度。 


层次聚类: 创建一个层次等级以分解给定的数据集。监狱里的对象分别是狱警、小偷、送餐员、或者其 他,他们等级应该是平等的,所以不行。此方法分为自上而下(分解)和自下而上(合并)两种操作方式。 


K-中心点聚类:挑选实际对象来代表簇,每个簇使用一个代表对象。它是围绕中心点划分的一种规则,所以这里并不合适。 


回归分析:处理变量之间具有相关性的一种统计方法,这里的狱警、小偷、送餐员、其他之间并没有什 么直接关系。 


结构分析: 结构分析法是在统计分组的基础上,计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构依时间推移而表现出的变化规律性的统计方法。结构分析法的基本表现形式,就是计算结构指标。这里也行不通。 


多分类问题: 针对不同的属性训练几个不同的弱分类器,然后将它们集成为一个强分类器。这里狱警、 小偷、送餐员 以及他某某,分别根据他们的特点设定依据,然后进行区分识别。 

来源:@刘炫320,链接:http://blog.csdn.net/column/details/16442.html




477题

关于 logit 回归和 SVM 不正确的是()


A、Logit回归目标函数是最小化后验概率


B、Logit回归可以用于预测事件发生概率的大小


C、SVM目标是结构风险最小化


D、SVM可以有效避免模型过拟合



点击下方空白区域查看答案

正确答案是:A


解析:

A. Logit回归本质上是一种根据样本对权值进行极大似然估计的方法,而后验概率正比于先验概率和似然函数的乘积。logit仅仅是最大化似然函数,并没有最大化后验概率,更谈不上最小化后验概率。而最小化后验概率是朴素贝叶斯算法要做的。A错误 


B. Logit回归的输出就是样本属于正类别的几率,可以计算出概率,正确 


C. SVM的目标是找到使得训练数据尽可能分开且分类间隔最大的超平面,应该属于结构风险最小化。 


D. SVM可以通过正则化系数控制模型的复杂度,避免过拟合。来源:@刘炫320,链接:http://blog.csdn.net/column/details/16442.html





478题

有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是( )


A、2x+y=4


B、x+2y=5


C、x+2y=3


D、2x-y=0



点击下方空白区域查看答案

正确答案是:C


解析:

这道题简化了,对于两个点来说,最大间隔就是垂直平分线,因此求出垂直平分线即可。斜率是两点连线的斜率的负倒数-1/((-1-3)/(0-2)) = -1/2, 可得y=-(1/2)x + c, 过中点((0+2)/2, (-1+3)/2) = (1, 1), 可得c=3/2, 故选C.





479题

下面有关分类算法的准确率,召回率,F1 值的描述,错误的是?


A、准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率


B、召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率


C、正确率、召回率和 F 值取值都在0和1之间,数值越接近0,查准率或查全率就越高


D、为了解决准确率和召回率冲突问题,引入了F1分数



点击下方空白区域查看答案

正确答案是:C


解析:

对于二类分类问题常用的评价指标是精准度(precision)与召回率(recall)。通常以关注的类为正类,其他类为负类,分类器在测试数据集上的预测或正确或不正确,4种情况出现的总数分别记作:

TP——将正类预测为正类数 

FN——将正类预测为负类数 

FP——将负类预测为正类数 

TN——将负类预测为负类数 


由此: 

精准率定义为:P = TP / (TP + FP) 

召回率定义为:R = TP / (TP + FN) 

F1值定义为: F1 = 2 P R / (P + R) 

精准率和召回率和F1取值都在0和1之间,精准率和召回率高,F1值也会高,不存在数值越接近0越高的说法,应该是数值越接近1越高。




480题

以下几种模型方法属于判别式模型(Discriminative Model)的有( ) 

1)混合高斯模型 

2)条件随机场模型 

3)区分度训练 

4)隐马尔科夫模型


A、2,3


B、3,4


C、1,4


D、1,2



点击下方空白区域查看答案

正确答案是:A


解析:

常见的判别式模型有: 

Logistic regression(logistical 回归) 

Linear discriminant analysis(线性判别分析)

Supportvector machines(支持向量机) 

Boosting(集成学习) 

Conditional random fields(条件随机场) 

Linear regression(线性回归) 

Neural networks(神经网络)


常见的生成式模型有: 

Gaussian mixture model and othertypes of mixture model(高斯混合及其他类型混合模型) 

Hidden Markov model(隐马尔可夫) 

NaiveBayes(朴素贝叶斯) 

AODE(平均单依赖估计) 

Latent Dirichlet allocation(LDA主题模型) 

Restricted Boltzmann Machine(限制波兹曼机) 

生成式模型是根据概率乘出结果,而判别式模型是给出输入,计算出结果。 

来源:@刘炫320,链接:http://blog.csdn.net/column/details/16442.html




题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习



今日推荐

我们的【深度学习集训营第二期】火热报名中。从TensorFlow起步实战BAT工业项目。11月13日起正式上课,为期一个多月,努力5周,挑战年薪40万,甚至更多薪!


这么好的机会,还在等什么,报名即送三门课程,《机器学习工程师 第八期》、《深度学习 第三期》、《TensorFlow框架案例实战》,更好的助力您学习深度学习集训营课程。且2人及2人以上组团报名,可各减500元,想组团者请加微信客服:julyedukefu_02


挑战高薪,从现在开始~



 更多资讯

 请戳一戳

往期推荐

困扰数学界160年的“黎曼猜想”到底是什么?

【内推】用了这么久支付宝,你难道不想来蚂蚁金服试试吗?

这10种深度学习方法,AI从业者必备!

那些年薪40万的人,究竟做对了什么?

干货 | 一图掌握整个深度学习核心知识体系【高清下载】

2019校招面试必备,15个CNN关键回答集锦【建议收藏】

拼团,咨询,查看课程,请点击下方 “ 阅读原文 

↓↓↓ 
登录查看更多
1

相关内容

【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
410+阅读 · 2020年6月8日
少标签数据学习,54页ppt
专知会员服务
202+阅读 · 2020年5月22日
机器学习速查手册,135页pdf
专知会员服务
342+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
359+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
168+阅读 · 2019年12月2日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
BAT机器学习面试1000题系列(第51~55题)
七月在线实验室
10+阅读 · 2017年10月8日
Reasoning on Knowledge Graphs with Debate Dynamics
Arxiv
14+阅读 · 2020年1月2日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
5+阅读 · 2018年1月29日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
410+阅读 · 2020年6月8日
少标签数据学习,54页ppt
专知会员服务
202+阅读 · 2020年5月22日
机器学习速查手册,135页pdf
专知会员服务
342+阅读 · 2020年3月15日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
359+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
168+阅读 · 2019年12月2日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
相关资讯
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
BAT机器学习面试1000题系列(第51~55题)
七月在线实验室
10+阅读 · 2017年10月8日
Top
微信扫码咨询专知VIP会员