常见的损失函数

1. 均方差损失 MSE Loss (L2 Loss)

  • 针对回归问题

MSE也称为L2 loss:
J_{MSE} = \frac{1} {N} \sum_{i=1}^{N} (y_i - \hat{y_i})^2
随着预测与真实值的绝对误差的增加,均方差损失呈二次方增加。

MSE Loss

2. 平均绝对误差损失 MAE Loss (L1 Loss)

  • 针对回归问题

J_{MAE} = \frac{1}{N} \sum_{i=1}^{N}{|y_i - \hat{y_i}|}

MAE Loss

MSE和MAE的区别

  • MSE可以更快收敛:
    MSE的损失梯度为-\hat{y_i},MAE的损失梯度为+-1,也就是说MSE的梯度scale会随着误差大小变化,而MAE的梯度则一直保持为1(即使是在绝对误差很小的情况下).

  • MAE对于outlier更加鲁棒:
    MAE损失对于绝对误差是线性关系,MSE是平方关系。当误差非常大的时候,MSE损失会远远大于MAE,导致对模型的影响比较大。

3. Huber Loss

  • 针对回归问题

Huber Loss将L1和L2结合起来,也被称做smoothed L1 Loss。增加了一个需要额外设置的超参数\delta,来控制L2和L1的连接位置。 在误差接近0的时候使用L2,使损失函数可导,梯度更加稳定;误差较大的时候用L1,可以降低outlier带来的巨大误差的影响。

Huber Loss

4. 交叉熵损失 Cross Entropy Loss

  • 针对分类问题

二分类

二分类中,通常使用Sigmoid函数将模型的输出压缩到(0, 1)区间。给定输入x_i,模型判断为正类/负类的概率:
p(y_i =1 | x_i) = p_i
p(y_i = 0 | x_i) = 1 - p_i

合并成一个:
p(y_i|x_i) = (p_i)^{y_i} (1 - p_i)^{1-y_i}

取对数加负号之后,得到:
\mathcal{L}_{CE} = -\sum_{i=1}^{N}{(y_i \log(p_i) + (1-y_i) \log(1-p_i))}
N是所有样本的数量。

图中曲线可以看出,当预测值越接近目标值损失越小,随着误差变差,损失呈现指数增长。


Cross Entropy Loss

多分类

真实值y_i现在是一个One-hot向量,Sigmoid换成了Softmax来把输出值压缩到(0, 1)之间,所有维度的输出和为1.

Softmax公式:
S_i = \frac{e^i}{\sum_{j}{e^j}}

\mathcal{L}_{CE} = - \sum_{i=1}^{N} \sum_{k=1}^{K} y_i^k \log(p_i^k)
k \in K 表示K个类别中的一个,k只在对应的类别上是1,其他时候是0。
于是上式可以改写成:
\mathcal{L}_{CE} = -\sum_{i=1}^{N} y_i^{c_i} \log(p_i ^ {c_i})
c_i 是样本x_i的目标类。

Cross Entropy和MSE

分类问题中为什么不用MSE? 因为MSE假设了误差服从高斯分布,在分类任务下这个假设无法满足,因此效果会很差。

第二个论点是从信息论的角度来分析的,是关于由KL散度的角度来推导Cross Entropy的过程(原文

5. Hinge Loss

是另一种二分类损失函数,适用于Maximum-margin的分类,SVM的损失函数就是hinge loss + L2正则化
\mathcal{L}_{hinge} = \sum_{i=1}^{N} max(0, 1 - sgn(y_i)p_i)

下图为,当y为正类的时候(sgn(y_i) = 1),不同的输出p_i对应的loss图

Hinge Loss

当y为正类时,模型输出负值会有很大的惩罚。即使输出为正值在(0, 1)区间,也还是会有一个较小的惩罚。也就是只有置信度高的才会有零损失。使用hinge loss直觉上的理解是要找到一个决策边界,使得素有数据点被这个边界正确地,高置信度地被分类。
同时hinge loss也反应了一点,对于那些已经可以被很好分类的样本,它不再对loss产生贡献,可以让模型花更多的energy去学习难以分类的样本。

References

https://zhuanlan.zhihu.com/p/77686118

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,012评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,589评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,819评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,652评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,954评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,381评论 1 210
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,687评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,404评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,082评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,355评论 2 241
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,880评论 1 255
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,249评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,864评论 3 232
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,007评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,760评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,394评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,281评论 2 259