多伦多大学“神经网络与机器学习导论（2018年春季）

2018 年 4 月 3 日 人工智能头条 专注技术分享

http://www.cs.toronto.edu/~rgrosse/

来源 | 专知（公众号ID：Quan_Zhuanzhi）

【导读】多伦多大学计算机系助理教授 Roger Grosse 开设的《神经网络与机器学习导论》课程涵盖了从机器学习基础知识到深度学习、强化学习等高阶内容，是AI从业者最佳的学习上手材料之一。

▌概述

机器学习是一套强大的技术，它允许计算机从数据中学习，而不是让人类专家手工编程行为。神经网络是一类最初受大脑启发的机器学习算法，但最近在实际应用中取得了很多成功。它们是谷歌( Google )和 Facebook 等公司生产系统的核心，用于人脸识别、语音到文本以及语言理解。

本课程概述了神经网络算法的基本思想和最新进展。本课程的前 2/3 大致集中在有监督的学习上，即训练网络在有大量标记的行为示例时产生特定的行为。最后 1/3 集中于无监督学习和强化学习。

课程地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/

课程内容目录

第 1 讲：导言

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec01.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L01%20Introduction.pdf

介绍什么是机器学习和神经网络，你会用它们做什么？监督、无监督和强化学习。本课程的组织方式。

第 2 讲：线性回归

课件地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec02.pdf

讲义地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L02%20Linear%20Regression.pdf

线性回归，一种有监督的学习任务，您需要在其中预测标量值目标。将该问题转化为优化问题，直接求解或梯度下降求解。矢量化。特征映射和多项式回归。泛化：过拟合、欠拟合和验证。

第 3 讲：线性分类

二元线性分类。可视化线性分类器。感知器算法。线性分类器的极限。

课件地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec03.pdf

讲义地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L03%20Linear%20Classifiers.pdf

第 4 讲:学习分类器

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec04.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L04%20Training%20a%20Classifier.pdf

二进制分类中损失函数的比较。交叉熵损失、logistic 激活函数和 logistic 回归。铰链损失。多向分类。凸损失函数。梯度检查。(注:这实际上是一次半的讲座，会遇到第五次讲座的安排。)

第 5 讲：多层感知器

多层感知器。激活函数的比较。将深层神经网络视为函数组合和特征学习。线性网络的局限性和非线性网络的普适性。

课件地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec05.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L05%20Multilayer%20Perceptrons.pdf

建议阅读:深度学习书第 6.1 - 6.4 节

第 6 讲：反向传播

课件地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec06.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L06%20Backpropagation.pdf

反向传播算法，一种计算梯度的方法，我们在整个过程中使用。

第 7 讲：分布式表示

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec07.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L07%20Distributed%20Representations.pdf

语言建模、n - gram 模型(局部化表示)、神经语言模型(分布式表示)和跳跃图(另一分布式表示)。

第 8 讲：优化

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec08.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L08%20Optimization.pdf

如何使用通过反向投影计算的梯度。优化景观特点：局部优化、鞍点优化、高原优化、沟壑优化。随机梯度下降和动量。

建议阅读:深度学习书，第 8 章

第 9 讲：泛化

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec09.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L09%20Generalization.pdf

偏差/方差分解、数据增加、限制容量、提前停止、权重衰减、系综、随机正则化、超参数调整。

建议阅读：深度学习书，第 7 章

第 10 讲：自动微分

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec10.pdf

如何实现自动微分系统。基于自学者的教学实施签名。

第 11 讲：卷积网络

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec11.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L11%20Convolutional%20Networks.pdf

卷积运算。卷积层和池层。等方差和不变性。conv 网络的反向传播规则。

第 12 讲：图像分类

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec12.pdf

conv 网络体系结构在手写体数字和对象分类中的应用。测量坐标网的尺寸。

第 13 讲：追赶

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec13.pdf

没有第 13 课，因为我们迷信。此外，我们已经落后了一个完整的演讲时间表，所以这将使时间表与实际涵盖的内容同步。

第 14 课：优化输入

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec14.pdf

第 15 讲：递归神经网络

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec15.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L12%20Object%20Recognition.pdf

递归神经网络。时光倒流。将 RNNs 应用于语言建模和机器翻译。

第 16 讲：学习长期依赖关系

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec16.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L16%20Learning%20Long%20Term%20Dependencies.pdf

为什么 RNN 梯度爆炸和消失，无论是从背面机械的角度，还是从 RNN 计算的函数的概念。处理方法：渐变裁剪、输入反转、LSTM。

第 17 讲：学习和注意

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec17.pdf

深层残差网络。机器翻译和字幕生成的注意模型。

第 18 讲：学习概率模型

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec18.pdf

讲义地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/readings/L18%20Learning%20Probabilistic%20Models.pdf

极大似然估计。贝叶斯参数估计和最大后验估计的基础。

第 19 讲：生成对抗网络

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec19.pdf

专题待定

第 20 讲：自回归和可逆模型

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec20.pdf

专题待定

第 21 讲：政策梯度

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec21.pdf

下午：下午3时27分，下午1时至2时；晚上：下午3 : 27，7 - 8点

专题待定

第22讲：问答式学习

课件地址：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/slides/lec22.pdf

下午：下午3时29分，下午1时至2时；晚上：下午4 : 3，6 - 7点

专题待定

第 23 课：玩游戏

下午：下午4时3分，下午1时至2时；晚上： 4 / 3，晚上7 - 8点

专题待定

▌教程

请注意，下午部分的第一堂课之后没有教程，夜间部分的最后一堂课之后也没有教程。

教程 1：线性回归

课程地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/tutorials/tut1.pdf

教程 2：分类 [ [·伊普森笔记本]

地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/tutorials/tut2.pdf

教程 3：反向传播 [·伊普森笔记本] [推导( PDF ) ]

地址：http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/tutorials/tut3.pdf

教程 4：签名

教程 5：PyTorch

教程 6：Conv 网络

教程 7：中期审查

教程 8：注意和最大似然

教程 9：GANs

教程 10：策略梯度

▌课件介绍

参考链接：

http://www.cs.toronto.edu/~rgrosse/courses/csc321_2018/

扫描二维码，关注「人工智能头条」

回复“技术路线图”获取 AI 技术人才成长路线图

☟☟☟点击 | 阅读原文 | 查看更多精彩内容

登录查看更多

相关内容

机器学习导论

关注 1

【中科大】大数据算法（2020年春季）

专知会员服务

83+阅读 · 2020年5月16日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

175+阅读 · 2020年5月10日

【硬核课】最新《图卷积神经网络GCN》2020概述，76页ppt，NTU-Xavier Bresson，纽约大学深度学习课程

专知会员服务

159+阅读 · 2020年5月1日

【阿尔托大学】图神经网络，Graph Neural Networks，附60页ppt

专知会员服务

183+阅读 · 2020年4月26日

普渡大学2020硬核课程《鲁棒机器学习理论》课件与笔记，38讲173页pdf

专知会员服务

180+阅读 · 2020年3月28日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

多伦多大学2020春季CSC311课程「机器学习导论」，学习ML基础知识

专知会员服务

54+阅读 · 2020年1月13日

【课程】Geoffrey Hinton《神经网络机器学习》经典课程，附课程PPT下载

专知会员服务

46+阅读 · 2019年11月4日

【课程】概率图模型，卡内基梅隆大学邢波

专知会员服务

70+阅读 · 2019年11月4日

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知会员服务

85+阅读 · 2019年10月29日

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

专知

67+阅读 · 2020年2月24日

普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知

12+阅读 · 2019年6月13日

麻省理工2019年深度学习导论课程全套PPT

专知

14+阅读 · 2019年2月15日

【课程讲义】176页哥德堡大学人工神经网络讲义

专知

17+阅读 · 2019年1月24日

【干货】Geoffrey Hinton《神经网络机器学习》经典课程（附课程PPT下载）

专知

26+阅读 · 2019年1月16日

【干货】最新深度学习课程，多伦多大学“神经网络与机器学习导论（2018年Spring）（附课件下载）

专知

6+阅读 · 2018年3月25日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

盘点15个机器学习网络课程和文字教程

论智

7+阅读 · 2017年12月25日

一步上手深度学习！斯坦福李飞飞视频课程汉化版大放送 !（附学习资料）

数据派THU

7+阅读 · 2017年9月8日

神经网络理论基础及 Python 实现

Python开发者

6+阅读 · 2017年7月15日

How Useful is Self-Supervised Pretraining for Visual Tasks?

Arxiv

9+阅读 · 2020年3月31日

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

How to Fine-Tune BERT for Text Classification?

Arxiv

13+阅读 · 2019年5月14日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Inference in Probabilistic Graphical Models by Graph Neural Networks

Arxiv

3+阅读 · 2018年5月25日

Scalable attribute-aware network embedding with locality

Arxiv

4+阅读 · 2018年4月30日

TBD: Benchmarking and Analyzing Deep Neural Network Training

Arxiv

3+阅读 · 2018年3月16日

Variance-based regularization with convex objectives

Arxiv

5+阅读 · 2017年12月14日

VIP会员