【深度学习】深度学习入门概览,如何从小白到发表论文

2017 年 8 月 10 日 产业智能官 马索萌

作者:马索萌

链接:https://zhuanlan.zhihu.com/p/28305209

来源:知乎


之前我写过一篇文章 ,关于深度学习如何入门 。之后我发现还是有不少同学私信问我深度学习入门的事情,今天我就在原答案基础上扩展着讲讲。

首先回答一个不少人问我的问题,深度学习能用来干什么?

深度学习可以说是这一代人工智能的核心,驱动着现在最先进的计算机视觉系统,比如图像分类、物体检测识别等等。推荐算法、语音识别、自然语言处理、决策制定这些事情也有越来越多的深度学习。

图像的语义分割:

如何入门深度学习

在我看来,深度学习的学习研究分为三个阶段:基础知识 => 解决实际问题 => 发明创造。

阶段零:准备工作

要想学习深度学习,我认为首先得至少熟悉一门编程语言,最好是 Python。不然无法上手实验,容易变成纸上谈兵。

硬件方面,建议有一台计算力较强的电脑,显卡使用 NVIDIA GTX1070 以上。深度学习对内存(显存)和计算量的要求很大,低于这个配置会导致很多经典模型无法运行(比如吃显存的 VGG Net)。

此外,如果想要对深度学习的理论有详细的理解,需要一定的数学基础。高中数学加上微积分的基本知识(求导、链式法则)完全可以帮助你起飞。更好的数学基础可以让你在理解复杂模型、复杂的优化算法上游刃有余,但理解基础理论不需要太高深的数学。

最后,一个良好的心态可以帮助你更快地学习。深度学习并不困难,它的核心简单优美,相信自己可以掌握它。

阶段一:基础知识

没有什么比看一本简明扼要的薄书更容易入门。深度学习的资料非常多,但这也成为了深度学习坑最大的地方,学习者很容易迷失在各种资料当中,最后只看了个皮毛。所以,我认为学习深度学习一开始就要盯着你挑选的那么一两个资料学习,最多不要同时看三本书。所以下面我只给出两本书。

我推荐的第一本书Neural networks and deep learning  ,它足够薄,但深入浅出,兼顾了深度和难度,将深度学习的核心讲述的很清晰,还附带完善的代码实践,可谓入门的不二之选。这本书先是引入了最原始最简单的神经元和神经网络的概念,然后一步步引出全连接网络、激活函数、反向传播、优化方法、卷积神经网络等深度学习中最基本的内容,然后还给出一个视觉上的(非严格的)证明,神经网络可以计算任意函数(严格来讲,是有限制条件的)。书中还有大量的配图(其中还有很多可交互的动图),非常有助于理解。

这本书对应的是作者自己的 python 代码,自己从头实现一个神经网络非常有助于理解。这本书真正做到了深入浅出,在不失理论深度的同时让难度变得很低。下图就是它展示改进学习方法的一个例子,你甚至可以在浏览器里面改变参数的值然后点击右下角的按钮立马看到反馈效果,看到 cost 曲线是如何下降的。比较遗憾的是此书目前没有中文版,所以需要一定的英语阅读理解能力。

第二本更厚也更系统的书是Deep Learning  ,这本书目前已经出了中文版。相比于前一本书,这本书有更多细节,数学也更多,既可以当做教材也可以当做参考资料。 这本书可以在看完第一本之后看也可以直接看。

第一个阶段花费的时间因人而异,每个人基础不同,从两个星期到几个月都有可能。

阶段二:运用深度学习解决实际问题

在学习基础知识之后,就可以着手解决具体的问题,有以下几件事情可以做

找一个好用的主流框架(推荐 Pytorch),把教程和示例代码跑一遍。然后使用这套框架去解决你感兴趣的问题,比如在你自己的数据集上训练物体识别。

阅读经典的论文并重复实验。自己去复现经典论文的算法非常有助于理解。

将算法融入一个应用当中,比如可以用人脸检测识别算法做一个老板来了的报警器,嘿嘿。或者将深度学习算法融合到手机当中。

这个阶段你可能会遇到大量的问题,这个时候你需要发挥搜索引擎的作用,不断地搜索,不断地阅读,最终解决问题。我常去各个官方文档、技术论坛、Stack Overflow 和博客上阅读资料。经历了这个过程,你所学的理论知识将得到检验,你将成为一名熟练的深度学习工程师。

阶段三:发明创造

最后一个阶段就是突破前人的领域。在熟悉深度学习之后,你会发现前人的理论有大量解决不了的问题,前人的工具可能并不是100%称手。所以你需要创造出自己的新知识、新工具,分为两个方面:

1、 理论创新,解决前人解决不了的问题,或者更好地解决问题,提出新的认识世界的方法。要在理论上有所突破,一个常规的方法是找一个专门的问题开始钻研,不断地试验自己的想法,前人没有的想法。同时阅读这个领域最新的文章,尝试实现。比如你可以挑物体检测这个问题,既然你对于理论和实践都已经比较熟练了,你完全可以开始修改别人的网络架构,改变训练的模式,尝试把先验信息加进来。总之,有很多的玩法都可以实验。说不定玩着玩着就能写一篇文章出来发表。

2、 工程创造,实现自己的深度学习框架。曾经看过一个观点,轮子不需要被重新发明,但需要重新创造。理论上的东西,发现一次就够了,但是工程实现在一次次的迭代中完善进步。对于深度学习,可以尝试实现一个自己的深度学习框架。目前深度学习离不开 c/c++ 和 cuda,所以你可以从头写一个 c/c++ 版本的,把坑自己踩一遍,这样工程能力肯定大为提高。或者,你也可以利用现有框架的后端实现一个前端,这样你对于这些框架后端的理解也能够大为提高。且你的所有的想法都可以写进这个前端里面。比如 pytorch 就是用 torch 的后端实现了一个 python 的前端,而且相比于原版的 torch 有了很多改进。

关于发表论文

论文是用来向世界展示你的成果的,所以发表论文的第一要素是你有创新点,可以是你完成了新的实验、提出了新的理论、创造了新的工具等等。计算机视觉是一门偏应用的学科,最常规的发论文方法就是

1、 选择一个你想要解决的问题;

2、 调研已有的解决方法和它们的缺陷;

3、 改进解决问题的方法,改进效果,提高准确率;

4、 总结自己的方法,写成论文。


 



新一代技术+商业操作系统:AI-CPS OS

     

新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利AI-CPS OS形成字化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生,在行业、企业和自身三个层面勇立鳌头。


数字化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置。

  • 分辨率革命种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品控制、事件控制和结果控制。

  • 复合不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。

  • 边界模糊化:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。


领导者无法依靠某种单一战略方法来应对多维度的数字化变革。随着变革范围不断扩大,一切都几乎变得不确定,即使是最精明的领导者也可能失去方向。面对新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能颠覆性的数字化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位。


如果不能在上述三个层面保持领先,领导力将会不断弱化并难以维继: 

  • 重新进行行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?

  • 重新构建你的企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?

  • 重新打造新的自己:你需要成为怎样的人?要重塑自己并在数字化时代保有领先地位,你必须如何去做?


子曰:“君子和而不同,小人同而不和。”  《论语·子路》

云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。


如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。

在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。

云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!


人工智能通过三个方式激发经济增长:

  1. 创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;

  2. 对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;

  3. 人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。


新一代信息技术(云计算、大数据、物联网、区块链和人工智能)的商业化落地进度远不及技术其本身的革新来得迅猛,究其原因,技术供应商(乙方)不明确自己的技术可服务于谁,传统企业机构(甲方)不懂如何有效利用新一代信息技术创新商业模式和提升效率。


“产业智能官”,通过甲、乙方价值巨大的云计算、大数据、物联网、区块链和人工智能的论文、研究报告和商业合作项目,面向企业CEO、CDO、CTO和CIO,服务新一代信息技术输出者和新一代信息技术消费者。


助力新一代信息技术公司寻找最有价值的潜在传统客户与商业化落地路径,帮助传统企业选择与开发适合自己的新一代信息技术产品和技术方案,消除新一代信息技术公司与传统企业之间的信息不对称,推动云计算、大数据、物联网、区块链和人工智能的商业化浪潮。


给决策制定者和商业领袖的建议:

  1. 迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新

    评估未来的知识和技能类型;

  2. 制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开

    发过程中确定更加明晰的标准和最佳实践;

  3. 重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临

    较高失业风险的人群;

  4. 超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机

    器智能,为企业创造新商机;

  5. 开发人工智能型企业所需新能力:员工团队需要积极掌握判断、沟通及创造

    性思维等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多

    样性的文化也非常重要。


新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。

重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。

新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能正在经历从“概念”到“落地”,最终实现“大范围规模化应用,深刻改变人类生活”的过程。





产业智能官  AI-CPS



新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能),在场景中状态感知-实时分析-自主决策-精准执行-学习提升认知计算机器智能实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链




长按上方二维码关注微信公众号: AI-CPS,更多信息回复:


新技术“云计算”、“大数据”、“物联网”、“区块链”、“人工智能新产业:智能制造”、“智能驾驶”、“智能金融”、“智能城市”、“智能零售新模式:案例分析”、“研究报告”、“商业模式”、“供应链金融”、“财富空间”






本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!



版权声明产业智能官(公众号ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com







登录查看更多
7

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《深度学习》圣经花书的数学推导、原理与Python代码实现
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
【新书】傻瓜式入门深度学习,371页pdf
专知会员服务
188+阅读 · 2019年12月28日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
【开源书】PyTorch深度学习起步,零基础入门(附pdf下载)
专知会员服务
110+阅读 · 2019年10月26日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
卷积神经网络从入门到精通
人工智能头条
6+阅读 · 2019年3月29日
深度学习如何调参?
炼数成金订阅号
6+阅读 · 2018年10月18日
深度学习、图像识别入门,从VGG16卷积神经网络开始
数据挖掘入门与实战
8+阅读 · 2018年3月28日
零基础小白,如何入门计算机视觉?
计算机视觉life
9+阅读 · 2018年3月8日
荐书丨深度学习入门之PyTorch
程序人生
18+阅读 · 2017年12月1日
干货 | 深度学习入门指北——从硬件到软件
AI科技评论
3+阅读 · 2017年11月22日
入门 | 一文概览深度学习中的激活函数
机器之心
7+阅读 · 2017年11月2日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
Arxiv
35+阅读 · 2020年1月2日
Arxiv
6+阅读 · 2019年9月25日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
5+阅读 · 2018年10月11日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
22+阅读 · 2018年2月14日
Arxiv
16+阅读 · 2018年2月7日
Arxiv
9+阅读 · 2018年1月30日
VIP会员
相关VIP内容
《深度学习》圣经花书的数学推导、原理与Python代码实现
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
【新书】傻瓜式入门深度学习,371页pdf
专知会员服务
188+阅读 · 2019年12月28日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
【开源书】PyTorch深度学习起步,零基础入门(附pdf下载)
专知会员服务
110+阅读 · 2019年10月26日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
相关资讯
卷积神经网络从入门到精通
人工智能头条
6+阅读 · 2019年3月29日
深度学习如何调参?
炼数成金订阅号
6+阅读 · 2018年10月18日
深度学习、图像识别入门,从VGG16卷积神经网络开始
数据挖掘入门与实战
8+阅读 · 2018年3月28日
零基础小白,如何入门计算机视觉?
计算机视觉life
9+阅读 · 2018年3月8日
荐书丨深度学习入门之PyTorch
程序人生
18+阅读 · 2017年12月1日
干货 | 深度学习入门指北——从硬件到软件
AI科技评论
3+阅读 · 2017年11月22日
入门 | 一文概览深度学习中的激活函数
机器之心
7+阅读 · 2017年11月2日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
相关论文
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
Arxiv
35+阅读 · 2020年1月2日
Arxiv
6+阅读 · 2019年9月25日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
5+阅读 · 2018年10月11日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
22+阅读 · 2018年2月14日
Arxiv
16+阅读 · 2018年2月7日
Arxiv
9+阅读 · 2018年1月30日
Top
微信扫码咨询专知VIP会员