今日面试题
防止过拟合的方法
解析:
过拟合的原因是算法的学习能力过强;一些假设条件(如样本独立同分布)可能是不成立的;训练样本过少不能对整个空间进行分布估计。
处理方法:
1、早停止:如在训练中多次迭代后发现模型性能没有显著提高就停止训练;
2、数据集扩增:原有数据增加、原有数据加随机噪声、重采样;
3、正则化,正则化可以限制模型的复杂度;
4、交叉验证;
5、特征选择/特征降维;
6、创建一个验证集是最基本的防止过拟合的方法。我们最终训练得到的模型目标是要在验证集上面有好的表现,而不训练集。
END
今日学习推荐
【金融风控实战】
首次完整公开一线平台金融风控核心技术
5月11日开课
3人拼团,仅需499元
扫描下方二维码
了解课程详情
☟
长按识别二维码
后台回复:100 免费领取【机器学习面试100题】
后台回复:干货 免费领取【全体系人工智能学习资料】
后台回复: 领资料 【NLP工程师必备干货资料】