【深度学习】Medium网友分享了一篇帖子 介绍了他的深度学习心路历程

2019 年 10 月 26 日 产业智能官

Medium网友Favio Vázquez分享了他是如何学习深度学习并利用它来解决数据科学问题的。这是一个非正式的帖子,但内容很有趣。以下是他分享的内容。

关于我和深度学习的一点介绍
我的专业是物理和计算机工程。我在委内瑞拉学习过,后来在墨西哥做过物理学硕士。但我认为自己是一个数据科学家。因此,尽管我在数学、微积分和统计学方面有很好的背景,但从头开始学习机器学习和深度学习对我来说并不容易。这些主题并不新鲜,但是我们研究它们的方式,我们如何构建使用它们的软件和解决方案,以及我们与它们进行编程或交互的方式已经发生了巨大的改变。

我从哪里开始着手?
在我学习计算机工程的时候,有一个关于“人工智能(Artificial Intelligence)”的课程。对于这个课程,我时常会产生一些困惑。因此,我研究了专家系统(expert system),神经网络(neural net),遗传算法(genetic algorithm),并阅读了一些论文,我发现其中两篇非常有趣:

  • 阿兰·图灵的《计算机器与智能》(Computing Machinery and Intelligence)

  • 玛格丽特·博登的《创造力和人工智能》(Creativity and artificial intelligence)

当我阅读这些论文之前(我不知道机器学习的进展,或者它甚至存在),我认为我们离实现真正的人工智能还有很远的距离。所以,那时的我(22岁)对人工智能失去希望,于是我开始研究量子计算,对我来说,这是在人工智能之前发生的事情。然而,看看下图,事实证明我错了:

我对人工智能的兴趣

在2014年(24岁),我刚刚从物理系毕业,在做我的关于黑洞模拟工程的论文时,我意外地发现了Coursera、机器学习、吴恩达和Apache Spark。这对我来说无疑是个巨大的惊喜。

我对严谨的在线学习感到惊讶,我以前没有尝试过这样的课程(我仍然不知道为什么),于是我开始学习所有的课程,从基因组学到天文学,从Scala到Python,从机器学习到Søren Kierkegaard的哲学理论。

我没有学习捷径,也没有导师,所以我只是在探索这个世界,试着找出我想要做些什么。与此同时(2014年底),我在机器学习和Apache Spark项目中发现了吴恩达的课程,并在两周内完成了这门课程,我简直不敢相信这一领域有多么惊人。然后我开始编写我在Scala和Apache Spark中所学到的知识,因此我了解了分布式计算、Hadoop、HDFS以及所有这些伟大的东西。

我的一些早期(不是很好的)机器学习和spark的项目,你可以在我的GitHub上找到它们。

  • GitHub地址:https://github.com/FavioVazquez

我的第一个数据科学工作

我在2014年获得了第一份数据科学工作,我是公司里唯一的数据科学家,试图弄明白我们可以用数据做什么。在工作中我发现,事情不像在课上学到的那样简单!我不再在R中导入Iris数据集,我处理的是奇怪的数据,并且我不知道数据在现实生活中是“肮脏的”。但我一直都在学习。有趣的是,我当时并不确定数据科学是什么。我主要在Scala和Python中构建了一些简单的模型。

然后过了一段时间,我意识到我喜欢开源(Open Source)。我开始在一些简单的项目中进行合作,其中一些项目是我自己的,然后还有一些是Apache Spark这样的大型项目。有简单的项目,也有高级的项目,我觉得我是在为社会做贡献。

宇宙冒险

Roger Penrose的共形循环宇宙学理论

数据科学是继我对物理学和宇宙学之后的第二次热情,所以我来到墨西哥做物理学硕士。这是一次令人惊奇的经历,但仍有一些缺失。我需要代码!我爱上了编程!

我选修了基础物理课程,如经典力学,量子力学,但也有数值方法,高性能计算,以及贝叶斯推理和机器学习。在我的论文中,我用Python编写了很多代码,所以我很高兴。

成为一名数据科学家

当我完成我的硕士学位(2017年)的时候,我决定我想做的是帮助大家成为一名数据科学家。是的,我花了一段时间。

如果你想知道我是如何在这个领域找到一份令人惊叹的工作的,那就看看我在几周前做的一篇博客文章:如何找到一份数据科学家的工作?

  • 文章地址:https://towardsdatascience.com/how-to-get-a-job-as-a-data-scientist-f417078fe13e

我也开始在我的LinkedIn上分享我的经历、想法和知识,这是非常重要的事情。我认识了很棒的人,这对我有很大帮助,现在我也在帮助别人。

  • LinkedIn地址:https://www.linkedin.com/in/faviovazquez/

每天我学习,代码,在开源项目中做贡献,并且帮助人们,所以我对我正在做的事情很满意。

深度学习呢?

等等,看到现在,你可能想问,这难道不是一个关于深度学习的帖子吗?

是的,但是我需要告诉你为什么现在的深度学习对我来说很重要。

作为一名数据科学家,你需要更新理论、技术和框架;因此,去年我们看到了深度学习的爆炸式增长,就在我对机器学习开始适应的时候,这是一个全新的学习方式。

但是,你知道我从哪里开始的吗?

是的!正是吴恩达的deeplearning.ai的学习课程。

  • deeplearning.ai学习地址:https://www.deeplearning.ai/

我真的对他感到惊讶。当我才开始接触这个领域时,他已经在教授这个领域的课程了。是的,我还在做这些课程。但我并没有就此止步。我也需要更多的实用信息。

于是我开始学习TensorFlow,然后是Keras。Keras是一个高级的神经网络API,用Python编写,能够在TensorFlow、CNTK或Theano上面运行。这是由François Chollet开发的,专注于快速的实验。能够从想法到结果,再到最少的延迟,是进行良好研究的关键。

有很好的学习实践深度学习的资源,比如GitHub的repos和一些相关书籍。现在我正在阅读《Deep Learning with Python》这本书,它对我的学习真的很有帮助:

注:这本书有中文版,AiTechYun截取了一些豆瓣网友对此书的评价。

深度学习的未来

预测是一种艺术,它告诉我们将要发生什么,然后解释它为什么没有发生。

我不知道如何预测未来。但我能说的是,我看到的是什么,就会发生什么。

我去年看到的深度学习的最好的东西之一就是Deep Cognition。这是创建和部署人工智能的一个解决方案。简单的拖放界面可以帮助你轻松地设计深度学习模型。Deep Learning Studio可以自动为你的自定义数据集设计一个深度学习模型,这要归功于他们的高级的AutoML功能。

  • Deep Cognition:http://deepcognition.ai/

我认为图形用户界面(GUI)和AutoML可以是深度学习的未来。不要误解我的意思,我喜欢编码,你也可以在那里编码。但我认为,我们明年编写的代码数量将会衰减。我们不可能花那么多的时间在全世界范围内编程相同的东西,所以我认为GUI和AutoML将帮助数据科学家提高效率和解决更多的问题。


先进制造业+工业互联网




产业智能官  AI-CPS


加入知识星球“产业智能研究院”:先进制造业OT(自动化+机器人+工艺+精益)和工业互联网IT(云计算+大数据+物联网+区块链+人工智能)产业智能化技术深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的产业智能化平台;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。


产业智能化平台作为第四次工业革命的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎; 重构设计、生产、物流、服务等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生 新技术、新产品、新产业、新业态和新模式; 引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。

产业智能化技术分支用来的今天,制造业者必须了解如何将“智能技术”全面渗入整个公司、产品、业务等商业场景中, 利用工业互联网形成数字化、网络化和智能化力量,实现行业的重新布局、企业的重新构建和焕然新生。

版权声明产业智能官(ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。




登录查看更多
0

相关内容

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
86+阅读 · 2020年6月28日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
124+阅读 · 2020年5月26日
【资源】100+本免费数据科学书
专知会员服务
106+阅读 · 2020年3月17日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
199+阅读 · 2020年2月7日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
161+阅读 · 2019年10月28日
AI 从业者都会用到的 10 个深度学习方法
算法与数学之美
7+阅读 · 2018年12月31日
如何从零到一地开始机器学习 ?(附思维导图)
THU数据派
6+阅读 · 2018年4月17日
学不学吴恩达deeplearning.ai课程,看完这篇你就知道了
深度学习世界
3+阅读 · 2018年4月4日
这是一份「不正经」的深度学习简述
深度学习世界
4+阅读 · 2018年3月24日
深度学习的GPU:深度学习中使用GPU的经验和建议
数据挖掘入门与实战
11+阅读 · 2018年1月3日
干货|7步掌握基于Keras的深度学习!
全球人工智能
4+阅读 · 2017年11月14日
已删除
将门创投
5+阅读 · 2017年8月15日
TResNet: High Performance GPU-Dedicated Architecture
Arxiv
7+阅读 · 2020年3月30日
Arxiv
5+阅读 · 2020年3月26日
Arxiv
26+阅读 · 2019年3月5日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
5+阅读 · 2018年4月22日
VIP会员
相关VIP内容
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
126+阅读 · 2020年7月10日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
86+阅读 · 2020年6月28日
【纽约大学】最新《离散数学》笔记,451页pdf
专知会员服务
124+阅读 · 2020年5月26日
【资源】100+本免费数据科学书
专知会员服务
106+阅读 · 2020年3月17日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
199+阅读 · 2020年2月7日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
161+阅读 · 2019年10月28日
相关资讯
AI 从业者都会用到的 10 个深度学习方法
算法与数学之美
7+阅读 · 2018年12月31日
如何从零到一地开始机器学习 ?(附思维导图)
THU数据派
6+阅读 · 2018年4月17日
学不学吴恩达deeplearning.ai课程,看完这篇你就知道了
深度学习世界
3+阅读 · 2018年4月4日
这是一份「不正经」的深度学习简述
深度学习世界
4+阅读 · 2018年3月24日
深度学习的GPU:深度学习中使用GPU的经验和建议
数据挖掘入门与实战
11+阅读 · 2018年1月3日
干货|7步掌握基于Keras的深度学习!
全球人工智能
4+阅读 · 2017年11月14日
已删除
将门创投
5+阅读 · 2017年8月15日
相关论文
Top
微信扫码咨询专知VIP会员