笔记 | Andrew NG《神经网络和深度学习》之深度学习概论(下)

2017 年 11 月 8 日 菜鸟的机器学习 潇湘


《Deep Learning Specialization》由 deeplearning.ai 出品,让你在了解丰富的人工智能应用案例的同时,学会在实践中搭建出最先进的神经网络模型,训练出属于你自己的 AI。


《Deep Learning Specialization》包括五门课程,从今天开始,逐步的学习第一门课程“Course 1 Neural Networks and Deep Learning”,即“神经网络和深度学习”。


本文是“神经网络和深度学习”的第一周课“深度学习概论”的读书笔记。“深度学习概论”主要包括以下部分内容:

  • 1.1 欢迎来到深度学习工程师微专业

  • 1.2 什么是神经网络?

  • 1.3 用神经网络进行监督学习

  • 1.4 为什么深度学习会兴起?

  • 1.5 关于这门课

  • 1.6 课程资源


1.4 为什么深度学习会兴起?

如果深度学习和神经网络背后的基本技术理念,已经有好几十年了,为什么现在才突然流行起来呢?在这个视频中,让我们看一些让深度学习流行起来的主要因素。这将会帮助你在自己的组织中,发现好机会来应用这些东西。


在过去的几年里很多人问我,为什么深度学习突然这么厉害了?我回答的时候通常给他们画个图。横上代表完成任务的数据数量,垂直轴代表机器学习算法的性能,比如垃圾邮件过滤的准确率,广告点击预测的准确率,用于无人驾驶中判断其他车辆位置的神经网络的准确率。


根据图像可以发现,把传统机器学习算法的表现,比如说支持向量机,或logistic回归作为数据量的一个函数,你可能得到这样的曲线【上图中红色的曲线】。它的性能一开始增加数据时会上升,但是一段时间之后它的性能进入平台期。假设水平轴拉的很长很长,那是因为这些模型无法处理海量数据。而过去20年在我们的社会中,我们遇到的很多问题,早期只有相对较少的数据量,多亏了数字化社会,现在收集海量数据轻而易举。


我们人类花了很多时间在数字王国中,在电脑上,在网站上,在手机软件上,数字设备上的活动都能创造数据,同时也归功于便宜的相机,被内置到移动电话,还有加速仪,以及物联网中的各种传感器。我们收集到了越来越多的数据,过去20年,很多应用中我们收集到了大量的数据,远超过传统学习算法能发挥作用的规模。


神经网络模型的话,我们发现,如果你训练一个小型的神经网络,那么性能可能会像这样【上图中黄色的曲线】。如果你训练一个稍微大一点的神经网络,一个中等规模的神经网络,性能表现也会更好一些【上图中蓝色的曲线】。你训练一个非常大的神经网络,性能就会是这样,还会越来越好【上图中绿色的曲线,即最上面的】。


注意到两点,一点是如果你想达到这么高的性能水平,有两个条件。第一个是需要训练一个规模足够大的神经网络,以发挥数据规模量巨大的优点。另外,要到x轴的这个位置需要很多的数据。因此我们经常说,规模一直在推动深度学习的进步。


说到“规模”,我指的不仅是神经网络的规模,我们需要一个有许多隐藏单元的神经网络,有许多的参数,许多的连接,而且还有数据“规模”。事实上,要在神经网络上获得更好的表现,在今天最可靠的手段,往往就是要么训练一个更大的神经网络,要么投入更多的数据。这只能在一定程度上起作用,因为最终你耗尽了数据,或者最终你的网络规模太大,需要的训练时间太久。但提升规模已经让我们在深度学习的世界中获得了大量进展。


为了使这个图从技术上更准确一点,我还要加点说明。我在x轴下面已经写明了的数据量,技术点说,这是“带标签的数据”量。在训练样本时,我们有输入x和标签y。我介绍一点符号约定,这在后面的课程中都会用到。我们使用小写的字母m,表示训练集的规模,或者说训练样本的数量。这个小写字母m,这就是水平轴。


图像还有其他细节,训练集不大的这一块来说,各种算法的性能相对排名并不是很确定。训练集不大的时候,效果会取决于你手工设计的组件,会决定最终的表现。因此很有可能,假设有些人训练出了一个SVM,可能是因为手工设计组件很厉害,有些人训练的规模会大一些,可能训练集不大的时候,SVM表现更好。在这个图形区域的左边,各种算法之间优劣并不是定义得很明确,最终的性能更多取决于手工设计组件的技能,以及算法处理方面的一些细节。只有在大数据领域,非常庞大的训练集,也就是在右边m非常大时,我们才能见到,神经网络稳定地领先其它算法。


如果某个朋友问你,为什么神经网络这么流行?我鼓励你也给他们画这样一个图像,可以这么说,在深度学习崛起的初期,是数据和计算能力规模的进展。训练一个特别大的神经网络的能力,无论是在CPU还是GPU上,是这些发展才让我们取得了巨大的进步。


但是渐渐地,尤其是在最近这几年,我们也见证了算法方面的极大创新。我也不想忽略算法方面的巨大贡献。有趣的是,许多算法方面的创新,都为了让神经网络运行得更快。举一个具体的例子,神经网络方面的一个巨大突破是,从sigmoid函数转换到这样的ReLU函数。这个函数我们在之前的视频里提到过,形状就像这样。如果你无法理解,刚才我说的某个细节,也不需要担心。但使用sigmoid函数,机器学习问题是,对于这个区域 sigmoid函数的斜率,梯度会接近0,所以学习会变得非常缓慢,因为用梯度下降法时,梯度接近0时,参数会变化得很慢,学习也会变得很慢。而通过改变激活函数,神经网络用这个函数,修正线性单元ReLU,它的梯度对于所有为正值的输入输出都是1,因此梯度不会逐渐趋向0。而这里的梯度,这条线的斜率,在这左边是0。我们发现,只需将sigmod函数转换成ReLU函数,便能够使得“梯度下降法”运行得更快。


这就是一个例子,有点简单的算法创新的例子,但是最终算法创新所带来的影响,是增加计算速度。有很多像这样的例子,我们通过改变算法,使得代码运行得更快。这也使得我们,能够训练规模更大的神经网络,或者在合理的时间内完成计算。


即使在数据量很大,网络也很大的场合,快速计算很重要的另一个原因是,训练神经网络的过程,很多时候是凭直觉的。你有了关于神经网络架构的想法,然后你写代码实现你的想法。然后跑一下实验,可以告诉你,你的神经网络效果有多好,知道结果之后再回去,改你的神经网络中的一些细节。然后你不断重复这个循环。当你的神经网络需要很长时间去训练,需要很长时间才能走一圈循环的话,在实现神经网络时,迭代速度对你的效率影响巨大


如果你有一个想法,直接去试,10分钟后就能看到结果,或者最多花上一天。如果你训练你的神经网络,用了一个月的时间,有时候确实需要那么久。如果你能很快得到结果,比如10分钟或者一天内,你就可以尝试更多的想法。那你就很可能发现,适合你的应用的神经网络。所以计算速度的提升,真的有帮助提高迭代速度,让你更快地得到实验结果。这也同时帮助了神经网络的从业人员,和有关项目的研究人员,在深度学习的工作中迭代得更快,也能够更快地改进你的想法。所有这些都极大推动了,整个深度学习社区的研究,快到令人难以置信。


人们一直在发明新的算法,持续不断地进步,是这些力量支持了深度学习的崛起。但好消息是,这些力量还在不断发挥作用,让深度学习更进一步。我们看数据,我们的社会还在产生更多的数字化数据。我们看计算,GPU这类专用硬件还在继续发展,网络速度更快,各种硬件更快。我很有信心,我们实现超级大规模神经网络的能力,或者从计算能力这个角度看,也在继续进展。我们看算法,我希望深度学习研究社区,能在算法上持续创新。基于这些,我们可以乐观地回答,深度学习还会继续进步很多年。


让我们继续,最后一个课程视频中,我们会谈到通过这门课,你能学到什么。


链接:https://mooc.study.163.com/learn/2001281002?tid=2001392029#/learn/content?type=detail&id=2001702004


1.5 关于这门课

学习进度来到了这个“微专业”第一门课第一周的最后。快速地介绍一下,下一周将要学习什么内容。在第一个视频里我已经说过,本“微专业”一共有五门课,目前是第一门课。这门课将教会你最重要的基础知识,深度学习最重要的基础。第一门课的结尾,你将掌握如何建立并运用一个深度神经网络。


下面是第一门课的一些细节,这门课有四个星期的学习材料。目前你就要完成第一周的学习了,学完了深度学习的入门介绍。在每一周的结尾,都会有十道多选题,可以用来检验自己对材料的理解。当你看完这个视频的时候,希望你能看看这些问题,


在第二周你会学习到,神经网络的编程基础,了解神经网络中,“正向传播”和“反向传播”的结构,还有算法的过程,以及如何高效实现神经网络。从第二周开始,你也会开始做一些编程练习,练习学到的知识,自己实现算法,亲自调试到完美运行。当我学习算法的时候,那让我很过瘾,通过代码编程,亲自看到它完美运行。我希望你们也喜欢。


在学习了神经网络编程的框架之后,在第三周,你会编写单隐层神经网络,你需要学习所有必需的关键概念,才能实现神经网络。最后在第四周,你将建立了一个多层的深层神经网络,让它为你服务。


恭喜你完成了这段视频,我希望你现在对深度学习,有一个高层次的理解。也许有些人会想,自己想到了,哪里可以应用深度学习。我希望看完这段视频后,你会去看那10个多项选择题,它们就在课程网站上,来检查你的理解。不用复习,第一次做不知道所有答案,你可以多做几次,直到你都做对了为止。我觉得这些问题很有用,能保证我理解了所有概念,我希望你也可以做到。


1.6 课程资源

为了完成这门课,希望你知道有下面这些课程资料。


首先如果你有任何疑问,想和这个课程的其它同学讨论,想和包括我在内的教学人员讨论,或者想要归档一个错误报告,论坛是去做这些事情最好的地方。我和其他教学人员 会定期关注论坛,这也是一个,从与你一同学习本课程的同学获取答案的好地方。如果你想要回答同学们的问题,可以从课程首页来到课程的论坛。


如果你看到左侧的这个菜单栏,你的可能会看起来和我的有些不一样,但都会有这个论坛模块。当你点击它的时候,就会打开课程论坛。


在论坛上提问是问问题的最好方法,出于某些原因你可能想直接联系我们,或是想让我们知道一些问题,尽管把邮件发送到这个邮箱地址。我保证我们会阅读每一个邮件。我们会尽力去解决经常出现的问题,由于电子邮件的数量很多,我不能保证我们能够迅速回复每一封邮件,但是我们会阅读你发送的每一封邮件。


另外有些其它公司,想要给大批的职员培训深度学习的话,如果你在公司是负责培训工作,想深度学习专家来培训上百或者更多的雇员,尽管通过这个电子邮箱联系我们,我们看看能否帮到你。我们在开发大学课程,但处于早期的阶段,如果你是大学领导,或者管理人员,想在学校提供一门深度学习课程,请尽管通过这个邮箱地址联系我们。


我会提供更多的资源,来完成这门课程,也许我会在论坛见到你噢,祝你好运。


链接:https://mooc.study.163.com/learn/2001281002?tid=2001392029#/learn/content?type=detail&id=2001702005&cid=2001693079



友情链接:

笔记 | Andrew NG《神经网络和深度学习》之深度学习概论(上)




登录查看更多
7

相关内容

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
社区检测的深度学习:进展、挑战和机遇
专知会员服务
45+阅读 · 2020年7月9日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
30+阅读 · 2020年4月15日
复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版
神经网络与深度学习,复旦大学邱锡鹏老师
专知会员服务
116+阅读 · 2019年9月24日
大牛的《深度学习》笔记,Deep Learning速成教程
极市平台
18+阅读 · 2018年4月10日
为你推荐一份深度学习书单,来学习吧~
THU数据派
12+阅读 · 2018年3月13日
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
机器学习研究会
4+阅读 · 2018年3月10日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
入门 | 一文概览深度学习中的激活函数
深度学习世界
4+阅读 · 2017年11月3日
深度学习课程资源整理
AINLP
8+阅读 · 2017年9月28日
笔记 | 吴恩达Coursera Deep Learning学习笔记
AI100
4+阅读 · 2017年9月27日
课程 | Andrew Ng 深度学习课程笔记3
黑龙江大学自然语言处理实验室
3+阅读 · 2017年9月15日
Arxiv
12+阅读 · 2019年2月28日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
5+阅读 · 2018年1月16日
VIP会员
相关资讯
大牛的《深度学习》笔记,Deep Learning速成教程
极市平台
18+阅读 · 2018年4月10日
为你推荐一份深度学习书单,来学习吧~
THU数据派
12+阅读 · 2018年3月13日
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
机器学习研究会
4+阅读 · 2018年3月10日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
入门 | 一文概览深度学习中的激活函数
深度学习世界
4+阅读 · 2017年11月3日
深度学习课程资源整理
AINLP
8+阅读 · 2017年9月28日
笔记 | 吴恩达Coursera Deep Learning学习笔记
AI100
4+阅读 · 2017年9月27日
课程 | Andrew Ng 深度学习课程笔记3
黑龙江大学自然语言处理实验室
3+阅读 · 2017年9月15日
Top
微信扫码咨询专知VIP会员