怎样克服神经网络训练中argmax的不可导性?

2020 年 11 月 6 日 深度学习自然语言处理

来自 | 知乎

地址 | https://www.zhihu.com/question/422373907/answer/1490072620?

作者 | Zhenyue Qin

编辑 | 机器学习算法与自然语言处理公众号

本文仅作学术分享,若侵权,请联系后台删文处理


有个东西叫strainght through Gumbel (estimator), 可以看一下~

大概思想就是: 假设输入的向量是v, 那么我们用softmax得到softmax(v). 这样, 最大值那个地方就会变得很靠近1, 其他地方就会变得很靠近0. 然后, 我们计算argmax(v), 接着可以得到一个常数c = argmax(v) - softmax(v). 我们这时, 可以用softmax(v) + c来作为argmax(v)的结果. 这个东西的好处是, 我们的softmax(v) + c是有反向传播的能力的. 换句话说, 我们用softmax(v)的梯度来作为反向传播.

如果有哪点没说清楚, 欢迎评论. 谢谢.

P.S. 感谢吕纯川和Towser对于原回答的指正




  
  
    
下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!
后台回复【五件套


下载二:南大模式识别PPT
后台回复南大模式识别



说个正事哈



由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心



投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等

记得备注呦


推荐两个专辑给大家:
专辑 | 李宏毅人类语言处理2020笔记
专辑 | NLP论文解读
专辑 | 情感分析

整理不易,还望给个在看!

登录查看更多
0

相关内容

少即是多?非参数语言模型,68页ppt
专知会员服务
20+阅读 · 2020年11月22日
专知会员服务
44+阅读 · 2020年11月13日
专知会员服务
27+阅读 · 2020年10月9日
专知会员服务
42+阅读 · 2020年9月25日
【ST2020硬核课】深度神经网络,57页ppt
专知会员服务
43+阅读 · 2020年8月19日
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
393+阅读 · 2020年6月8日
一文带你了解MultiBERT
深度学习自然语言处理
16+阅读 · 2020年6月28日
【综述论文】2020年最新深度学习自然语言处理进展综述论文!!!
深度学习自然语言处理
13+阅读 · 2020年4月6日
李宏毅 -《深度学习人类语言处理》国语版(2020)视频课程及ppt分享
【Loss】深度学习的多个loss如何平衡?
深度学习自然语言处理
17+阅读 · 2020年3月18日
RL圣经出中文版了
CreateAMind
18+阅读 · 2019年9月13日
神经网络训练tricks
极市平台
6+阅读 · 2019年4月15日
对 ResNet 本质的一些思考
新智元
6+阅读 · 2019年4月12日
[深度学习] 我理解的循环神经网络RNN
机器学习和数学
16+阅读 · 2017年12月2日
机器学习应该准备哪些数学预备知识?
AI100
4+阅读 · 2017年11月26日
用神经网络训练一个文本分类器
Python开发者
3+阅读 · 2017年8月19日
Arxiv
0+阅读 · 2021年1月24日
Optimization for deep learning: theory and algorithms
Arxiv
102+阅读 · 2019年12月19日
Arxiv
11+阅读 · 2018年7月8日
VIP会员
相关VIP内容
少即是多?非参数语言模型,68页ppt
专知会员服务
20+阅读 · 2020年11月22日
专知会员服务
44+阅读 · 2020年11月13日
专知会员服务
27+阅读 · 2020年10月9日
专知会员服务
42+阅读 · 2020年9月25日
【ST2020硬核课】深度神经网络,57页ppt
专知会员服务
43+阅读 · 2020年8月19日
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
393+阅读 · 2020年6月8日
相关资讯
一文带你了解MultiBERT
深度学习自然语言处理
16+阅读 · 2020年6月28日
【综述论文】2020年最新深度学习自然语言处理进展综述论文!!!
深度学习自然语言处理
13+阅读 · 2020年4月6日
李宏毅 -《深度学习人类语言处理》国语版(2020)视频课程及ppt分享
【Loss】深度学习的多个loss如何平衡?
深度学习自然语言处理
17+阅读 · 2020年3月18日
RL圣经出中文版了
CreateAMind
18+阅读 · 2019年9月13日
神经网络训练tricks
极市平台
6+阅读 · 2019年4月15日
对 ResNet 本质的一些思考
新智元
6+阅读 · 2019年4月12日
[深度学习] 我理解的循环神经网络RNN
机器学习和数学
16+阅读 · 2017年12月2日
机器学习应该准备哪些数学预备知识?
AI100
4+阅读 · 2017年11月26日
用神经网络训练一个文本分类器
Python开发者
3+阅读 · 2017年8月19日
Top
微信扫码咨询专知VIP会员