BAT题库 | 机器学习面试1000题系列（第231~235题） - 专知

会员服务 ·

0

BAT题库 | 机器学习面试1000题系列（第231~235题）

2017 年 11 月 28 日 七月在线实验室

231.在一个n维的空间中，最好的检测outlier(离群点)的方法是：
A. 作正态分布概率图
B. 作盒形图
C. 马氏距离
D. 作散点图
答案：C
马氏距离是基于卡方分布的，度量多元outlier离群点的统计方法。

更多请详见：http://eurekastatistics.com/using-mahalanobis-distance-to-find-outliers/和http://blog.csdn.net/v_july_v/article/details/8203674

232.对数几率回归（logistics regression）和一般回归分析有什么区别？
A. 对数几率回归是设计用来预测事件可能性的
B. 对数几率回归可以用来度量模型拟合程度
C. 对数几率回归可以用来估计回归系数
D. 以上所有
答案：D
A: 对数几率回归其实是设计用来解决分类问题的
B: 对数几率回归可以用来检验模型对数据的拟合度
C: 虽然对数几率回归是用来解决分类问题的，但是模型建立好后，就可以根据独立的特征，估计相关的回归系数。就我认为，这只是估计回归系数，不能直接用来做回归模型。

233.bootstrap数据是什么意思？（提示：考“bootstrap”和“boosting”区别）
A. 有放回地从总共M个特征中抽样m个特征
B. 无放回地从总共M个特征中抽样m个特征
C. 有放回地从总共N个样本中抽样n个样本
D. 无放回地从总共N个样本中抽样n个样本
答案：C

234.“过拟合”只在监督学习中出现，在非监督学习中，没有“过拟合”，这是：
A. 对的
B. 错的
答案：B
我们可以评估无监督学习方法通过无监督学习的指标，如：我们可以评估聚类模型通过调整兰德系数（adjusted rand score）

235.对于k折交叉验证, 以下对k的说法正确的是 :
A. k越大, 不一定越好, 选择大的k会加大评估时间
B. 选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集)
C. 在选择k时, 要最小化数据集之间的方差
D. 以上所有
答案：D
k越大, bias越小, 训练时间越长. 在训练时, 也要考虑数据集间方差差别不大的原则. 比如, 对于二类分类问题, 使用2-折交叉验证, 如果测试集里的数据都是A类的, 而训练集中数据都是B类的, 显然, 测试效果会很差.
如果不明白bias和variance的概念, 参考:
Gentle Introduction to the Bias-Variance Trade-Off in Machine Learning
Understanding the Bias-Variance Tradeoff

往期题目：

BAT机器学习面试1000题系列（第1~60题）

BAT机器学习面试1000题系列（第61~100题）

BAT机器学习面试1000题系列（第101~200题）

BAT机器学习面试1000题系列（第201~205题）

BAT机器学习面试1000题系列（第206~210题）

BAT机器学习面试1000题系列（第211~215题）

BAT机器学习面试1000题系列（第216~220题）

BAT机器学习面试1000题系列（第221~225题）

BAT机器学习面试1000题系列（第226~230题）

课程咨询｜微信：julyedukefu

七月热线：010-82712840

登录查看更多

2

相关内容

对数几率回归

对数几率回归

【普林斯顿Yuxin Chen】噪声矩阵补全的推理与不确定性量化，117页ppt

【普林斯顿Yuxin Chen】噪声矩阵补全的推理与不确定性量化，117页ppt

专知会员服务

47+阅读 · 2020年6月29日

图机器学习-图拉普拉斯算子的离散正则性，141页ppt，Discrete regularity graph Laplacians

专知会员服务

29+阅读 · 2020年6月4日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

235+阅读 · 2020年5月2日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

专知会员服务

134+阅读 · 2020年4月14日

自回归模型:PixelCNN

自回归模型:PixelCNN

专知会员服务

27+阅读 · 2020年3月21日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

131+阅读 · 2020年3月15日

【斯坦福大学】面向机器学习的概率和统计要点速览(中文版)《CS 229 - Probabilities and Statistics refresher》by Afshine Amidi, Shervine Amidi

【斯坦福大学】面向机器学习的概率和统计要点速览(中文版)《CS 229 - Probabilities and Statistics refresher》by Afshine Amidi, Shervine Amidi

专知会员服务

48+阅读 · 2019年12月19日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

157+阅读 · 2019年11月26日

BAT机器学习面试题1000题（316~320题）

BAT机器学习面试题1000题（316~320题）

七月在线实验室

14+阅读 · 2018年1月18日

BAT机器学习面试题及解析（266-270题）

BAT机器学习面试题及解析（266-270题）

七月在线实验室

6+阅读 · 2017年12月13日

BAT题库 | 机器学习面试1000题系列（第226~230题）

BAT题库 | 机器学习面试1000题系列（第226~230题）

七月在线实验室

9+阅读 · 2017年11月27日

BAT题库 | 机器学习面试1000题系列（第211~215题）

BAT题库 | 机器学习面试1000题系列（第211~215题）

七月在线实验室

9+阅读 · 2017年11月22日

BAT题库 | 机器学习面试1000题系列（第196~200题）

BAT题库 | 机器学习面试1000题系列（第196~200题）

七月在线实验室

17+阅读 · 2017年11月16日

BAT题库 | 机器学习面试1000题系列（第191~195题）

BAT题库 | 机器学习面试1000题系列（第191~195题）

七月在线实验室

6+阅读 · 2017年11月15日

BAT题库 | 机器学习面试1000题系列（第161~165题）

BAT题库 | 机器学习面试1000题系列（第161~165题）

七月在线实验室

7+阅读 · 2017年11月6日

BAT机器学习面试1000题系列（第76~80题）

BAT机器学习面试1000题系列（第76~80题）

七月在线实验室

5+阅读 · 2017年10月13日

BAT机器学习面试1000题系列（第51~55题）

BAT机器学习面试1000题系列（第51~55题）

七月在线实验室

10+阅读 · 2017年10月8日

BAT机器学习面试1000题系列（第36~40题）

BAT机器学习面试1000题系列（第36~40题）

七月在线实验室

8+阅读 · 2017年10月3日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Bivariate Beta LSTM

Bivariate Beta LSTM

Arxiv

6+阅读 · 2019年10月7日

Summit: Scaling Deep Learning Interpretability by Visualizing Activation and Attribution Summarizations

Summit: Scaling Deep Learning Interpretability by Visualizing Activation and Attribution Summarizations

Arxiv

4+阅读 · 2019年9月2日

Towards Understanding Regularization in Batch Normalization

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

Implicit Maximum Likelihood Estimation

Implicit Maximum Likelihood Estimation

Arxiv

7+阅读 · 2018年9月24日

Asynchronous Byzantine Machine Learning (the case of SGD)

Arxiv

3+阅读 · 2018年7月9日

Billion-scale Network Embedding with Iterative Random Projection

Arxiv

5+阅读 · 2018年5月7日

Learning Recommendations While Influencing Interests

Arxiv

9+阅读 · 2018年3月23日

Inference Suboptimality in Variational Autoencoders

Arxiv

3+阅读 · 2018年1月10日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

VIP会员

相关主题

对数几率回归

相关VIP内容

【普林斯顿Yuxin Chen】噪声矩阵补全的推理与不确定性量化，117页ppt

【普林斯顿Yuxin Chen】噪声矩阵补全的推理与不确定性量化，117页ppt

专知会员服务

47+阅读 · 2020年6月29日

图机器学习-图拉普拉斯算子的离散正则性，141页ppt，Discrete regularity graph Laplacians

专知会员服务

29+阅读 · 2020年6月4日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

235+阅读 · 2020年5月2日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

【UIUC硬核书】统计学习理论，Statistical Learning Theory，213页pdf

专知会员服务

134+阅读 · 2020年4月14日

自回归模型:PixelCNN

自回归模型:PixelCNN

专知会员服务

27+阅读 · 2020年3月21日

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

Sklearn 与 TensorFlow 机器学习实用指南,385页pdf

专知会员服务

131+阅读 · 2020年3月15日

【斯坦福大学】面向机器学习的概率和统计要点速览(中文版)《CS 229 - Probabilities and Statistics refresher》by Afshine Amidi, Shervine Amidi

【斯坦福大学】面向机器学习的概率和统计要点速览(中文版)《CS 229 - Probabilities and Statistics refresher》by Afshine Amidi, Shervine Amidi

专知会员服务

48+阅读 · 2019年12月19日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

157+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】多目标奖励与偏好优化：理论与算法

《无形的防御者？将定向能武器集成到反无人机框架的机遇与挑战》报告

自主化海军：海上无人系统与未来海战

迈向智能体系统规模化的科学

相关资讯

BAT机器学习面试题1000题（316~320题）

BAT机器学习面试题1000题（316~320题）

七月在线实验室

14+阅读 · 2018年1月18日

BAT机器学习面试题及解析（266-270题）

BAT机器学习面试题及解析（266-270题）

七月在线实验室

6+阅读 · 2017年12月13日

BAT题库 | 机器学习面试1000题系列（第226~230题）

BAT题库 | 机器学习面试1000题系列（第226~230题）

七月在线实验室

9+阅读 · 2017年11月27日

BAT题库 | 机器学习面试1000题系列（第211~215题）

BAT题库 | 机器学习面试1000题系列（第211~215题）

七月在线实验室

9+阅读 · 2017年11月22日

BAT题库 | 机器学习面试1000题系列（第196~200题）

BAT题库 | 机器学习面试1000题系列（第196~200题）

七月在线实验室

17+阅读 · 2017年11月16日

BAT题库 | 机器学习面试1000题系列（第191~195题）

BAT题库 | 机器学习面试1000题系列（第191~195题）

七月在线实验室

6+阅读 · 2017年11月15日

BAT题库 | 机器学习面试1000题系列（第161~165题）

BAT题库 | 机器学习面试1000题系列（第161~165题）

七月在线实验室

7+阅读 · 2017年11月6日

BAT机器学习面试1000题系列（第76~80题）

BAT机器学习面试1000题系列（第76~80题）

七月在线实验室

5+阅读 · 2017年10月13日

BAT机器学习面试1000题系列（第51~55题）

BAT机器学习面试1000题系列（第51~55题）

七月在线实验室

10+阅读 · 2017年10月8日

BAT机器学习面试1000题系列（第36~40题）

BAT机器学习面试1000题系列（第36~40题）

七月在线实验室

8+阅读 · 2017年10月3日

相关论文

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Bivariate Beta LSTM

Bivariate Beta LSTM

Arxiv

6+阅读 · 2019年10月7日

Summit: Scaling Deep Learning Interpretability by Visualizing Activation and Attribution Summarizations

Summit: Scaling Deep Learning Interpretability by Visualizing Activation and Attribution Summarizations

Arxiv

4+阅读 · 2019年9月2日

Towards Understanding Regularization in Batch Normalization

Towards Understanding Regularization in Batch Normalization

Arxiv

4+阅读 · 2018年9月27日

Implicit Maximum Likelihood Estimation

Implicit Maximum Likelihood Estimation

Arxiv

7+阅读 · 2018年9月24日

Asynchronous Byzantine Machine Learning (the case of SGD)

Arxiv

3+阅读 · 2018年7月9日

Billion-scale Network Embedding with Iterative Random Projection

Arxiv

5+阅读 · 2018年5月7日

Learning Recommendations While Influencing Interests

Arxiv

9+阅读 · 2018年3月23日

Inference Suboptimality in Variational Autoencoders

Arxiv

3+阅读 · 2018年1月10日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员