点击上方,选择星标或置顶,每天给你送干货!
阅读大概需要5分钟
跟随小博主,每天进步一丢丢
来自 | 知乎
地址 | https://www.zhihu.com/question/295247085/answer/494511891
作者 | ivy zheng
编辑 | 机器学习算法与自然语言处理公众号
本文仅作学术分享,若侵权,请联系后台删文处理
谢邀。
Sigmoid函数:
Softmax函数:
其中:
因此这两个完全等价,连梯度消失的位置都是等价的。
关于 灵犀的问题:
采用sigmoid输出时,使用[0-1.0]的threshold来得到不同的precision和recall;
而采用softmax输出时,我们常常直接取两类中最大概率的类别(这种方法我理解应该是直接默认设置了threshold为0.5),那我如果在softmax下想获得PR曲线的话,应该怎么操作呢?
1、我觉得你对precision和recall有什么误解,如果计算PR曲线,需要的就是类别,而不是概率值。比如你准确率,就是正确匹配的除以总数,那么正确匹配的个数肯定是通过判定的类别是否正确得到啊。
2、如果想要得到概率,Softmax是可以的。CAFFE的Softmax层可以输出 的结果,比如有n个类,就可以得到一个向量 ,那么属于第 个类的概率就是:
____20190805补充_
经@空号 提醒,貌似对pr曲线部分表述错误。因为回答太久远了,不方便修改,就把空号的回复贴上,供大家参考。