一文详解正则化(regularization)

2021 年 2 月 3 日 PaperWeekly


©PaperWeekly 原创 · 作者|王东伟

单位|致趣百川

研究方向|深度学习


本文介绍正则化(regularization)。

神经网络模型通过最小化误差得到最优参数,其误差函数具有如下形式:

现在我们添加正则化项,得到优化目标:

称为目标函数(objective function)。添加正则化项的作用是防止模型过拟合,其中,1/2 系数仅仅是为了在求梯度的时候得到 而不是

以下通过一个简单的实验说明正则化的作用。

对直线 y=x 进行等间距采样,并且加入随机噪声,得到 10 个数据样本如下:


▲ 图1


采用以 Sigmoid 为激活函数的 2 层神级网络模型拟合训练数据,图 2.1、2.2 分别为