今日面试题分享:解决bias和Variance问题的方法是什么?

2019 年 3 月 19 日 七月在线实验室


长按识别上方二维码,关注:七月在线实验室,回复关键词:100

即可免费领取【100道机器学习面试题(上)】PDF版本一份


今日面试题分享
解决bias和Variance问题的方法是什么?


参考答案:


解析:

High bias解决方案:Boosting、复杂模型(非线性模型、增加神经网络中的层)、更多特征 High Variance解决方案:bagging、简化模型、降维  


具体而言 

高偏差, 可以用boosting模型, 对预测残差进行优化, 直接降低了偏差. 也可以用高模型容量的复杂模型(比如非线性模型, 深度神经网络), 更多的特征, 来增加对样本的拟合度. 

高方差, 一般使用平均值法, 比如bagging, 或者模型简化/降维方法, 来降低方差. 


高偏差和高方差都是不好的, 我们应该加以避免. 但是它们又是此消彼长的关系, 所以必须权衡考虑. 一般情况下, 交叉验证训练可以取得比较好的平衡: 

将原始样本均分成K组, 将每组样本分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型, 这K个模型可以并发训练以加速. 用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标. K一般大于等于3, 而K-CV 的实验共需要建立 k 个models,并计算 k 次 test sets 的平均预测正确率。 


在实作上,k 要够大才能使各回合中的 训练样本数够多,一般而言 k=10 (作为一个经验参数)算是相当足够了。


题目来源:七月在线官网(www.julyedu.com)——面试题库——面试大题——机器学习




今日学习推荐

【PyTorch的入门与实战】

16小时带你实战PyTorch 1.0 

四大课程特色  八大实战项目


长按识别下方二维码

免费试听

👇

长按识别二维码



备战AI求职季 | 100道机器学习面试题(上)

机器学习中的数学基础(微积分和概率统计)

一文详解机器学习中最好用的提升方法:Boosting 与 AdaBoost

34个最优秀好用的Python开源框架

【实战分享】电影推荐系统项目实战应用

万字长文概述NLP中的深度学习技术



咨询,查看课程,请点击“阅读原文

「 在看的,麻烦点一下再走~ 」


登录查看更多
3

相关内容

【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
150+阅读 · 2020年6月27日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
50+阅读 · 2020年2月19日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
今日面试题分享:L1和L2的区别
七月在线实验室
7+阅读 · 2019年3月14日
今日面试题分享:为什么xgboost要用泰勒展开,优势在哪里?
今日面试题分享:简单介绍下LR
七月在线实验室
7+阅读 · 2019年2月20日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
深度学习面试100题(第81-85题)
七月在线实验室
16+阅读 · 2018年8月6日
深度学习面试100题(第76-80题)
七月在线实验室
6+阅读 · 2018年8月3日
干货 | 一文总结机器学习类面试问题与思路
THU数据派
3+阅读 · 2018年7月15日
AI笔试面试题库-Python题目解析1
七月在线实验室
5+阅读 · 2018年6月27日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关资讯
今日面试题分享:L1和L2的区别
七月在线实验室
7+阅读 · 2019年3月14日
今日面试题分享:为什么xgboost要用泰勒展开,优势在哪里?
今日面试题分享:简单介绍下LR
七月在线实验室
7+阅读 · 2019年2月20日
BAT机器学习面试1000题(721~725题)
七月在线实验室
11+阅读 · 2018年12月18日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
深度学习面试100题(第81-85题)
七月在线实验室
16+阅读 · 2018年8月6日
深度学习面试100题(第76-80题)
七月在线实验室
6+阅读 · 2018年8月3日
干货 | 一文总结机器学习类面试问题与思路
THU数据派
3+阅读 · 2018年7月15日
AI笔试面试题库-Python题目解析1
七月在线实验室
5+阅读 · 2018年6月27日
Top
微信扫码咨询专知VIP会员