一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源 - 专知

会员服务 ·

2

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

2019 年 12 月 2 日 量子位

鱼羊编译整理
量子位报道 | 公众号 QbitAI

想要真正了解深度神经网络是如何训练的，免不了从矩阵微积分说起。

虽然网络上已经有不少关于多元微积分和线性代数的在线资料，但它们通常都被视作两门独立的课程，资料相对孤立，也相对晦涩。

不过，先别打退堂鼓，来自旧金山大学的Terence Parr教授说：矩阵微积分真的没有那么难。

这位ANTLR之父和fast.ai创始人Jeremy Howard一起推出了一篇免费教程，旨在帮你快速入门深度学习中的矩阵微积分。简明，易懂。

DeepMind研究科学家Andrew Trask评价说：

如果你想跳过不相干的内容，一文看尽深度学习中所需的数学知识，那么就是这份资源没错了。

只需一点关于微积分和神经网络的基础知识，就能单刀直入，开始以下的学习啦。

深度学习所需的矩阵微积分

先来看一眼这篇教程都涵盖了哪些内容：

基本概念

矩阵微积分

神经元激活的梯度

神经网络损失函数的梯度

文章开篇，先介绍了一下人工神经元。

神经网络中单个计算单元的激活函数，通常使用权重向量w与输入向量x的点积来计算。

神经网络由许多这样的单位组成。它们被组织成称为层的神经元集合。上一层单元的激活成为下一层单元的输入，最后一层中一个或多个单元的激活称为网络输出。

训练神经元意味着对权重w和偏差b的选择。我们的目标是逐步调整w和b，使总损失函数在所有输入x上都保持较小。

导数规则、向量计算、偏导数……复习完需要掌握的先导知识，文章开始进入重要规则的推导，这些规则涉及矢量偏导数的计算，是神经网络训练的基础。

比如在矩阵微积分这一节中，涵盖：

雅可比式（Jacobian）的推广
向量element-wise二元算子的导数
涉及标量展开的导数
向量和降维
链式法则

每一小节中，都有简洁明了的示例，由浅入深，层层递进。

如果你在学习的过程中遇到不理解的地方，不要着急，耐心返回上一节阅读，重新演算一下文中的示例，或许就能理顺思路。

如果实在是卡住了无法推进，你还可以在fast.ai论坛（链接见文末）的“Theory”分类下提问，向Parr和Howard本人求解答。

而在文章的末尾，作者附上了所有数学符号的对照表。

以及重点概念的详细补充信息。

值得注意的是，Parr和Howard也强调了，与其他学术方法不同，他们强烈建议先学会如何训练和使用神经网络，然后再深入了解背后的基础数学。因为有了实践经验，数学会变得刚容易理解。

传送门

网页版：
https://explained.ai/matrix-calculus/index.html

PDF：
https://arxiv.org/abs/1802.01528

fast.ai论坛：
http://forums.fast.ai/

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

大咖齐聚！参会嘉宾重磅揭晓

量子位 MEET 2020 智能未来大会启幕，李开复、倪光南、景鲲、周伯文、吴明辉、曹旭东、叶杰平、唐文斌、王砚峰、黄刚、马原等AI大咖与你一起读懂人工智能。观众票即将售罄，扫码报名预定席位 ~

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

17

相关内容

矩阵微积分

矩阵微积分

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

269+阅读 · 2020年6月10日

最新《自动微分手册》77页pdf

最新《自动微分手册》77页pdf

专知会员服务

103+阅读 · 2020年6月6日

最新《机器学习理论初探》概述

最新《机器学习理论初探》概述

专知会员服务

48+阅读 · 2020年5月19日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

92+阅读 · 2020年5月5日

干货书《数据科学数学系基础》2020最新版，266页pdf

干货书《数据科学数学系基础》2020最新版，266页pdf

专知会员服务

322+阅读 · 2020年3月23日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

324+阅读 · 2020年3月6日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

285+阅读 · 2019年12月2日

【课程】Geoffrey Hinton《神经网络机器学习》经典课程，附课程PPT下载

【课程】Geoffrey Hinton《神经网络机器学习》经典课程，附课程PPT下载

专知会员服务

46+阅读 · 2019年11月4日

【资源】机器学习数学全书，1900页PDF下载

【资源】机器学习数学全书，1900页PDF下载

全球人工智能

156+阅读 · 2019年10月17日

一书吃透机器学习！新版《机器学习基础》来了，教材PDF、PPT可下载 | 资源

一书吃透机器学习！新版《机器学习基础》来了，教材PDF、PPT可下载 | 资源

量子位

46+阅读 · 2019年5月19日

33页深度学习矩阵运算基础教程（附全文下载）

33页深度学习矩阵运算基础教程（附全文下载）

专知

27+阅读 · 2019年1月1日

最新深度学习入门高赞教材，只需高中数学基础 | 资源

最新深度学习入门高赞教材，只需高中数学基础 | 资源

量子位

5+阅读 · 2018年11月3日

吴恩达过时了？这群俄国人推出机器学习新课程，附大波资源链接

吴恩达过时了？这群俄国人推出机器学习新课程，附大波资源链接

量子位

12+阅读 · 2018年9月23日

【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上

【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上

机器学习研究会

4+阅读 · 2018年3月10日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

送你一份深度学习10大在线免费课程资源！

送你一份深度学习10大在线免费课程资源！

THU数据派

4+阅读 · 2017年12月11日

入门 | 一文概览深度学习中的激活函数

入门 | 一文概览深度学习中的激活函数

深度学习世界

4+阅读 · 2017年11月3日

图解高等数学|线性代数

图解高等数学|线性代数

遇见数学

39+阅读 · 2017年10月18日

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

A Survey on Distributed Machine Learning

Arxiv

45+阅读 · 2019年12月20日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

dynnode2vec: Scalable Dynamic Network Embedding

dynnode2vec: Scalable Dynamic Network Embedding

Arxiv

14+阅读 · 2018年12月6日

The Matrix Calculus You Need For Deep Learning

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年4月22日

When and Why are Pre-trained Word Embeddings Useful for Neural Machine Translation?

Arxiv

3+阅读 · 2018年4月18日

Cross-Domain Image Matching with Deep Feature Maps

Arxiv

14+阅读 · 2018年4月6日

Biomedical Question Answering via Weighted Neural Network Passage Retrieval

Arxiv

10+阅读 · 2018年1月9日

Implementing the Deep Q-Network

Arxiv

3+阅读 · 2017年11月20日

VIP会员

相关主题

矩阵微积分

相关VIP内容

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

269+阅读 · 2020年6月10日

最新《自动微分手册》77页pdf

最新《自动微分手册》77页pdf

专知会员服务

103+阅读 · 2020年6月6日

最新《机器学习理论初探》概述

最新《机器学习理论初探》概述

专知会员服务

48+阅读 · 2020年5月19日

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

来自Fariz Darari博士的一份简明《神经网络与深度学习》的讲义，64页ppt

专知会员服务

92+阅读 · 2020年5月5日

干货书《数据科学数学系基础》2020最新版，266页pdf

干货书《数据科学数学系基础》2020最新版，266页pdf

专知会员服务

322+阅读 · 2020年3月23日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

324+阅读 · 2020年3月6日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》

专知会员服务

285+阅读 · 2019年12月2日

【课程】Geoffrey Hinton《神经网络机器学习》经典课程，附课程PPT下载

【课程】Geoffrey Hinton《神经网络机器学习》经典课程，附课程PPT下载

专知会员服务

46+阅读 · 2019年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

【资源】机器学习数学全书，1900页PDF下载

【资源】机器学习数学全书，1900页PDF下载

全球人工智能

156+阅读 · 2019年10月17日

一书吃透机器学习！新版《机器学习基础》来了，教材PDF、PPT可下载 | 资源

一书吃透机器学习！新版《机器学习基础》来了，教材PDF、PPT可下载 | 资源

量子位

46+阅读 · 2019年5月19日

33页深度学习矩阵运算基础教程（附全文下载）

33页深度学习矩阵运算基础教程（附全文下载）

专知

27+阅读 · 2019年1月1日

最新深度学习入门高赞教材，只需高中数学基础 | 资源

最新深度学习入门高赞教材，只需高中数学基础 | 资源

量子位

5+阅读 · 2018年11月3日

吴恩达过时了？这群俄国人推出机器学习新课程，附大波资源链接

吴恩达过时了？这群俄国人推出机器学习新课程，附大波资源链接

量子位

12+阅读 · 2018年9月23日

【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上

【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上

机器学习研究会

4+阅读 · 2018年3月10日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

送你一份深度学习10大在线免费课程资源！

送你一份深度学习10大在线免费课程资源！

THU数据派

4+阅读 · 2017年12月11日

入门 | 一文概览深度学习中的激活函数

入门 | 一文概览深度学习中的激活函数

深度学习世界

4+阅读 · 2017年11月3日

图解高等数学|线性代数

图解高等数学|线性代数

遇见数学

39+阅读 · 2017年10月18日

相关论文

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

A Survey on Distributed Machine Learning

Arxiv

45+阅读 · 2019年12月20日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

dynnode2vec: Scalable Dynamic Network Embedding

dynnode2vec: Scalable Dynamic Network Embedding

Arxiv

14+阅读 · 2018年12月6日

The Matrix Calculus You Need For Deep Learning

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年4月22日

When and Why are Pre-trained Word Embeddings Useful for Neural Machine Translation?

Arxiv

3+阅读 · 2018年4月18日

Cross-Domain Image Matching with Deep Feature Maps

Arxiv

14+阅读 · 2018年4月6日

Biomedical Question Answering via Weighted Neural Network Passage Retrieval

Arxiv

10+阅读 · 2018年1月9日

Implementing the Deep Q-Network

Arxiv

3+阅读 · 2017年11月20日

大家都在搜

国防科技创新

CMU博士论文

无人机集群

牛津博士论文

久别重逢话双塔

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员