深度学习笔记系列(一):导数,梯度与方向导数

2019 年 11 月 27 日 AINLP

最近看论文的时候会感觉自己有很多基础的部分不是很扎实,所以准备系统地整理一下这些知识,并且记录下来。


这一部分的笔记之后会包括高等数学,线性代数,概率论,机器学习,信息论深度学习的相关知识以及其应用,之后也会慢慢的更新。


知乎传送门:https://zhuanlan.zhihu.com/p/93294877


第一篇讲的是导数,梯度和方向导数。


导数


单变量导数的一阶导数


对于单变量来说,其导数的计算方法如下:

导数代表的意义是函数在x处的变化率,当导数为0时x可能为函数的鞍点或者极值点。


单变量函数的二阶导数


二阶导数代表的意义是函数在x点处导数的变化率。


二阶导数的计算方式如下:



二阶导数为0,说明该点的导数变化率为0。


偏导数


当一个函数有多个变量,而你只想计算函数与某个变量的变化关系时,就需要计算偏导数。

偏导数的计算方式如下:



当函数在某点  的所有偏导数都为0时,则该点为函数的极值点或者鞍点。




梯度


在机器学习的学习中,梯度这一词想必大家都不陌生,多元函数的所有偏导数构成的向量即为梯度。



梯度的本意是一个向量,表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大,为该梯度的模。


方向导数


从上面的内容大家可以看到偏导数只能描绘x,y方向上函数的变化率,但是在实际的使用过程中,我们想知道函数在各个方向上的变化率,于是就有了方向导数的概念。


方向导数是一个标量,方向导数定义了点 x 处沿向量 v 方向变化时,对应的函数的瞬时变化率。其中v为:



将v变为单位向量v'后,通过计算:



就可以得到函数在这个方向上的方向导数。



所有的文章整理后会发布在 https://github.com/linhaow/DLnotes


本文转载在公众号:纸鱼AI,作者:linhw



推荐阅读

Transformer详解《attention is all your need》论文笔记

BERT源码分析PART I

BERT源码分析PART II

BERT源码分析PART III

站在BERT肩膀上的NLP新秀们(PART I)

站在BERT肩膀上的NLP新秀们(PART II)

站在BERT肩膀上的NLP新秀们(PART III)

Nvidia League Player:来呀比到天荒地老

关于AINLP


AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP君微信(id:AINLP2),备注工作/研究方向+加群目的。


登录查看更多
2

相关内容

耶鲁大学《分布式系统理论》笔记,491页pdf
专知会员服务
45+阅读 · 2020年7月29日
【经典书】概率统计导论第五版,730页pdf
专知会员服务
241+阅读 · 2020年7月28日
最新《自动微分手册》77页pdf
专知会员服务
102+阅读 · 2020年6月6日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
197+阅读 · 2020年5月2日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
195+阅读 · 2019年10月10日
面试时让你手推公式不在害怕 | 梯度下降
计算机视觉life
14+阅读 · 2019年3月27日
博客 | MIT—线性代数(下)
AI研习社
6+阅读 · 2018年12月20日
入门 | 一文介绍机器学习中基本的数学符号
机器之心
28+阅读 · 2018年4月9日
【干货】理解深度学习中的矩阵运算
机器学习研究会
18+阅读 · 2018年2月12日
吴恩达深度学习系列课程
平均机器
4+阅读 · 2018年2月1日
小白都能看懂的神经网络入门,快收下吧~
码农翻身
3+阅读 · 2018年1月4日
tensorflow系列笔记:流程,概念和代码解析
北京思腾合力科技有限公司
30+阅读 · 2017年11月11日
干货 | 深度学习之损失函数与激活函数的选择
机器学习算法与Python学习
15+阅读 · 2017年9月18日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Deep Learning for Energy Markets
Arxiv
10+阅读 · 2019年4月10日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
4+阅读 · 2018年10月31日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
6+阅读 · 2018年2月24日
Arxiv
3+阅读 · 2017年7月6日
VIP会员
相关VIP内容
耶鲁大学《分布式系统理论》笔记,491页pdf
专知会员服务
45+阅读 · 2020年7月29日
【经典书】概率统计导论第五版,730页pdf
专知会员服务
241+阅读 · 2020年7月28日
最新《自动微分手册》77页pdf
专知会员服务
102+阅读 · 2020年6月6日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
197+阅读 · 2020年5月2日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
195+阅读 · 2019年10月10日
相关资讯
面试时让你手推公式不在害怕 | 梯度下降
计算机视觉life
14+阅读 · 2019年3月27日
博客 | MIT—线性代数(下)
AI研习社
6+阅读 · 2018年12月20日
入门 | 一文介绍机器学习中基本的数学符号
机器之心
28+阅读 · 2018年4月9日
【干货】理解深度学习中的矩阵运算
机器学习研究会
18+阅读 · 2018年2月12日
吴恩达深度学习系列课程
平均机器
4+阅读 · 2018年2月1日
小白都能看懂的神经网络入门,快收下吧~
码农翻身
3+阅读 · 2018年1月4日
tensorflow系列笔记:流程,概念和代码解析
北京思腾合力科技有限公司
30+阅读 · 2017年11月11日
干货 | 深度学习之损失函数与激活函数的选择
机器学习算法与Python学习
15+阅读 · 2017年9月18日
相关论文
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Deep Learning for Energy Markets
Arxiv
10+阅读 · 2019年4月10日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
4+阅读 · 2018年10月31日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
6+阅读 · 2018年2月24日
Arxiv
3+阅读 · 2017年7月6日
Top
微信扫码咨询专知VIP会员