BAT机器学习面试1000题(561~565题)

2018 年 10 月 26 日 七月在线实验室

点击上方     蓝字关注七月在线实验室




BAT机器学习面试1000题(561~565题)


561题

下列哪个不属于常用的文本分类的特征选择算法?


A、卡方检验值


B、互信息


C、信息增益


D、主成分分析



点击下方空白区域查看答案

正确答案是:D


解析:

主成分分析是特征转换算法(特征抽取),而不是特征选择




562题

在数据清理中,下面哪个不是处理缺失值的方法?


A、估算


B、整例删除


C、变量删除


D、成对删除



点击下方空白区域查看答案

正确答案是:D


解析:

数据清理中,处理缺失值的方法有两种: 

一、删除法:

 1)删除观察样本 

2)删除变量:当某个变量缺失值较多且对研究目标影响不大时,可以将整个变量整体删除 

3)使用完整原始数据分析:当数据存在较多缺失而其原始数据完整时,可以使用原始数据替代现有数据进行分析 

4)改变权重:当删除缺失数据会改变数据结构时,通过对完整数据按照不同的权重进行加权,可以降低删除缺失数据带来的偏差


二、查补法:均值插补、回归插补、抽样填补等




563题

统计模式分类问题中,当先验概率未知时,可以使用()


A、最小最大损失准则


B、最小误判概率准则


C、最小损失准则


D、N-P判决



点击下方空白区域查看答案

正确答案是:A


解析:

A. 考虑p(wi)变化的条件下,是风险最小 


B. 最小误判概率准则, 就是判断p(w1|x)和p(w2|x)哪个大,x为特征向量,w1和w2为两分类,根据贝叶斯公式,需要用到先验知识 


C. 最小损失准则,在B的基础之上,还要求出p(w1|x)和p(w2|x)的期望损失,因为B需要先验概率,所以C也需要先验概率 


D. N-P判决,即限定一类错误率条件下使另一类错误率为最小的两类别决策,即在一类错误率固定的条件下,求另一类错误率的极小值的问题,直接计算p(x|w1)和p(x|w2)的比值,不需要用到贝叶斯公式_





564题

决策树的父节点和子节点的熵的大小关系是什么?


A、A. 决策树的父节点更大


B、B. 子节点的熵更大


C、C. 两者相等


D、D. 根据具体情况而定



点击下方空白区域查看答案

正确答案是:D


解析:

正确答案:D。 

假设一个父节点有2正3负样本,进一步分裂

情况1:两个叶节点(2正,3负);

情况2:两个叶节点(1正1负,1正2负)。

分别看下情况1和情况2,分裂前后确实都有信息增益,但是两种情况里不是每一个叶节点都比父节点的熵小。





565题

语言模型的参数估计经常使用MLE(最大似然估计)。面临的一个问题是没有出现的项概率为0,这样会导致语言模型的效果不好。为了解决这个问题,需要使用( )


A、平滑


B、去噪


C、随机插值


D、增加白噪音



点击下方空白区域查看答案

正确答案是:A


解析:

A,拉普拉斯平滑假设,将分子和分母各加上一个常数项。




题目来源:七月在线官网(https://www.julyedu.com/)——面试题库——笔试练习——机器学习




今日学习推荐

推荐系统实战

首次全面公开推荐技术在BAT中的核心应用
BAT一线讲师+核心算法讲解+九大实战项目
应用场景:电商+视频+新闻 




咨询/报名/组团可添加微信客服

julyedukefu_02

👇

长按识别二维码


 更多资讯

 请戳一戳

往期推荐

贺「七月在线」获好未来产业基金千万元天使投资(送书等炒鸡福利)

【Github 3.5K 星】PyTorch资源列表:450个NLP/CV/SP、论文实现、库、教程&示例

【盘点】深度学习最常用到的20个Python库

如何交付机器学习项目:一份机器学习工程开发流程指南

点击 “阅读原文,免费领取 →新人大礼包

↓↓↓ 
登录查看更多
1

相关内容

在统计中,主成分分析(PCA)是一种通过最大化每个维度的方差来将较高维度空间中的数据投影到较低维度空间中的方法。给定二维,三维或更高维空间中的点集合,可以将“最佳拟合”线定义为最小化从点到线的平均平方距离的线。可以从垂直于第一条直线的方向类似地选择下一条最佳拟合线。重复此过程会产生一个正交的基础,其中数据的不同单个维度是不相关的。 这些基向量称为主成分。
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
40+阅读 · 2020年3月21日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
347+阅读 · 2020年2月15日
谷歌机器学习速成课程中文版pdf
专知会员服务
143+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
机器学习面试题精讲(一)
七月在线实验室
4+阅读 · 2018年1月11日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT题库 | 机器学习面试1000题系列(第161~165题)
七月在线实验室
7+阅读 · 2017年11月6日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
Arxiv
19+阅读 · 2018年10月25日
Arxiv
5+阅读 · 2018年6月12日
VIP会员
相关资讯
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(376~380题)
七月在线实验室
9+阅读 · 2018年8月27日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
机器学习面试题精讲(一)
七月在线实验室
4+阅读 · 2018年1月11日
BAT题库 | 机器学习面试1000题系列(第211~215题)
七月在线实验室
9+阅读 · 2017年11月22日
BAT题库 | 机器学习面试1000题系列(第196~200题)
七月在线实验室
17+阅读 · 2017年11月16日
BAT题库 | 机器学习面试1000题系列(第191~195题)
七月在线实验室
6+阅读 · 2017年11月15日
BAT题库 | 机器学习面试1000题系列(第161~165题)
七月在线实验室
7+阅读 · 2017年11月6日
BAT机器学习面试1000题系列(第116~120题)
七月在线实验室
16+阅读 · 2017年10月24日
BAT机器学习面试1000题系列(第76~80题)
七月在线实验室
5+阅读 · 2017年10月13日
Top
微信扫码咨询专知VIP会员