会员服务 ·

0

今日面试题分享：解决bias和Variance问题的方法是什么？

2019 年 3 月 19 日 七月在线实验室

undefined

长按识别上方二维码，关注：七月在线实验室，回复关键词：100

即可免费领取【100道机器学习面试题（上）】PDF版本一份

今日面试题分享

解决bias和Variance问题的方法是什么？

参考答案：

解析：

High bias解决方案:Boosting、复杂模型（非线性模型、增加神经网络中的层）、更多特征 High Variance解决方案：bagging、简化模型、降维

具体而言

高偏差, 可以用boosting模型, 对预测残差进行优化, 直接降低了偏差. 也可以用高模型容量的复杂模型(比如非线性模型, 深度神经网络), 更多的特征, 来增加对样本的拟合度.

高方差, 一般使用平均值法, 比如bagging, 或者模型简化/降维方法, 来降低方差.

高偏差和高方差都是不好的, 我们应该加以避免. 但是它们又是此消彼长的关系, 所以必须权衡考虑. 一般情况下, 交叉验证训练可以取得比较好的平衡:

将原始样本均分成K组, 将每组样本分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型, 这K个模型可以并发训练以加速. 用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标. K一般大于等于3, 而K-CV 的实验共需要建立 k 个models，并计算 k 次 test sets 的平均预测正确率。

在实作上，k 要够大才能使各回合中的训练样本数够多，一般而言 k=10 (作为一个经验参数)算是相当足够了。

题目来源：七月在线官网（www.julyedu.com）——面试题库——面试大题——机器学习

今日学习推荐

【PyTorch的入门与实战】

16小时带你实战PyTorch 1.0

四大课程特色八大实战项目

长按识别下方二维码

免费试听

👇

长按识别二维码

●备战AI求职季 | 100道机器学习面试题（上）

●机器学习中的数学基础（微积分和概率统计）

●一文详解机器学习中最好用的提升方法：Boosting 与 AdaBoost

●34个最优秀好用的Python开源框架

●【实战分享】电影推荐系统项目实战应用

●万字长文概述NLP中的深度学习技术

点

咨询，查看课程，请点击“阅读原文”

「在看的，麻烦点一下再走~ 」

登录查看更多

3

相关内容

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

专知会员服务

154+阅读 · 2020年6月27日

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

专知会员服务

51+阅读 · 2020年2月19日

【AI学习实战资料】人工智能实战就业(面试)学习路线图' by TangYudi GitHub

【AI学习实战资料】人工智能实战就业(面试)学习路线图' by TangYudi GitHub

专知会员服务

114+阅读 · 2020年2月8日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

专知会员服务

98+阅读 · 2019年12月4日

今日面试题分享：L1和L2的区别

今日面试题分享：L1和L2的区别

七月在线实验室

7+阅读 · 2019年3月14日

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

七月在线实验室

22+阅读 · 2019年3月13日

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

七月在线实验室

11+阅读 · 2019年3月12日

今日面试题分享：简单介绍下LR

今日面试题分享：简单介绍下LR

七月在线实验室

7+阅读 · 2019年2月20日

深度学习面试100题（第81-85题）

深度学习面试100题（第81-85题）

七月在线实验室

17+阅读 · 2018年8月6日

Variance Reduction Methods for Sublinear Reinforcement Learning

Arxiv

4+阅读 · 2018年4月25日

Learning to Extract Coherent Summary via Deep Reinforcement Learning

Arxiv

6+阅读 · 2018年4月19日

Learning a Robust Society of Tracking Parts using Co-occurrence Constraints

Arxiv

4+阅读 · 2018年4月5日

SpectralLeader: Online Spectral Learning for Single Topic Models

Arxiv

4+阅读 · 2018年2月16日

Variance-based regularization with convex objectives

Arxiv

5+阅读 · 2017年12月14日

VIP会员

相关主题

非线性模型

Boosting（一种模型训练加速方式）

相关VIP内容

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

【2020新书】监督机器学习，156页pdf，剑桥大学出版社

专知会员服务

154+阅读 · 2020年6月27日

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》

专知会员服务

51+阅读 · 2020年2月19日

【AI学习实战资料】人工智能实战就业(面试)学习路线图' by TangYudi GitHub

【AI学习实战资料】人工智能实战就业(面试)学习路线图' by TangYudi GitHub

专知会员服务

114+阅读 · 2020年2月8日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

专知会员服务

98+阅读 · 2019年12月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《超越连接：AI驱动网络未来愿景》最新报告

人工智能赋能多域作战：能力与挑战

《战场空间决策优势：AI基础与应用研究》总结报告

相关资讯

今日面试题分享：L1和L2的区别

今日面试题分享：L1和L2的区别

七月在线实验室

7+阅读 · 2019年3月14日

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

七月在线实验室

22+阅读 · 2019年3月13日

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

七月在线实验室

11+阅读 · 2019年3月12日

今日面试题分享：简单介绍下LR

今日面试题分享：简单介绍下LR

七月在线实验室

7+阅读 · 2019年2月20日

深度学习面试100题（第81-85题）

深度学习面试100题（第81-85题）

七月在线实验室

17+阅读 · 2018年8月6日

相关论文

Variance Reduction Methods for Sublinear Reinforcement Learning

Arxiv

4+阅读 · 2018年4月25日

Learning to Extract Coherent Summary via Deep Reinforcement Learning

Arxiv

6+阅读 · 2018年4月19日

Learning a Robust Society of Tracking Parts using Co-occurrence Constraints

Arxiv

4+阅读 · 2018年4月5日

SpectralLeader: Online Spectral Learning for Single Topic Models

Arxiv

4+阅读 · 2018年2月16日

Variance-based regularization with convex objectives

Arxiv

5+阅读 · 2017年12月14日

大家都在搜

大型语言模型

蓝牙安全攻防

滴滴司机调度系统实践

微信扫码咨询专知VIP会员