Medium网友Favio Vázquez分享了他是如何学习深度学习并利用它来解决数据科学问题的。这是一个非正式的帖子,但内容很有趣。以下是他分享的内容。
关于我和深度学习的一点介绍
我的专业是物理和计算机工程。我在委内瑞拉学习过,后来在墨西哥做过物理学硕士。但我认为自己是一个数据科学家。因此,尽管我在数学、微积分和统计学方面有很好的背景,但从头开始学习机器学习和深度学习对我来说并不容易。这些主题并不新鲜,但是我们研究它们的方式,我们如何构建使用它们的软件和解决方案,以及我们与它们进行编程或交互的方式已经发生了巨大的改变。
我从哪里开始着手?
在我学习计算机工程的时候,有一个关于“人工智能(Artificial Intelligence)”的课程。对于这个课程,我时常会产生一些困惑。因此,我研究了专家系统(expert system),神经网络(neural net),遗传算法(genetic algorithm),并阅读了一些论文,我发现其中两篇非常有趣:
阿兰·图灵的《计算机器与智能》(Computing Machinery and Intelligence)
玛格丽特·博登的《创造力和人工智能》(Creativity and artificial intelligence)
当我阅读这些论文之前(我不知道机器学习的进展,或者它甚至存在),我认为我们离实现真正的人工智能还有很远的距离。所以,那时的我(22岁)对人工智能失去希望,于是我开始研究量子计算,对我来说,这是在人工智能之前发生的事情。然而,看看下图,事实证明我错了:
我对人工智能的兴趣
在2014年(24岁),我刚刚从物理系毕业,在做我的关于黑洞模拟工程的论文时,我意外地发现了Coursera、机器学习、吴恩达和Apache Spark。这对我来说无疑是个巨大的惊喜。
我对严谨的在线学习感到惊讶,我以前没有尝试过这样的课程(我仍然不知道为什么),于是我开始学习所有的课程,从基因组学到天文学,从Scala到Python,从机器学习到Søren Kierkegaard的哲学理论。
我没有学习捷径,也没有导师,所以我只是在探索这个世界,试着找出我想要做些什么。与此同时(2014年底),我在机器学习和Apache Spark项目中发现了吴恩达的课程,并在两周内完成了这门课程,我简直不敢相信这一领域有多么惊人。然后我开始编写我在Scala和Apache Spark中所学到的知识,因此我了解了分布式计算、Hadoop、HDFS以及所有这些伟大的东西。
我的一些早期(不是很好的)机器学习和spark的项目,你可以在我的GitHub上找到它们。
GitHub地址:https://github.com/FavioVazquez
我的第一个数据科学工作
我在2014年获得了第一份数据科学工作,我是公司里唯一的数据科学家,试图弄明白我们可以用数据做什么。在工作中我发现,事情不像在课上学到的那样简单!我不再在R中导入Iris数据集,我处理的是奇怪的数据,并且我不知道数据在现实生活中是“肮脏的”。但我一直都在学习。有趣的是,我当时并不确定数据科学是什么。我主要在Scala和Python中构建了一些简单的模型。
然后过了一段时间,我意识到我喜欢开源(Open Source)。我开始在一些简单的项目中进行合作,其中一些项目是我自己的,然后还有一些是Apache Spark这样的大型项目。有简单的项目,也有高级的项目,我觉得我是在为社会做贡献。
宇宙冒险
Roger Penrose的共形循环宇宙学理论
数据科学是继我对物理学和宇宙学之后的第二次热情,所以我来到墨西哥做物理学硕士。这是一次令人惊奇的经历,但仍有一些缺失。我需要代码!我爱上了编程!
我选修了基础物理课程,如经典力学,量子力学,但也有数值方法,高性能计算,以及贝叶斯推理和机器学习。在我的论文中,我用Python编写了很多代码,所以我很高兴。
成为一名数据科学家
当我完成我的硕士学位(2017年)的时候,我决定我想做的是帮助大家成为一名数据科学家。是的,我花了一段时间。
如果你想知道我是如何在这个领域找到一份令人惊叹的工作的,那就看看我在几周前做的一篇博客文章:如何找到一份数据科学家的工作?
文章地址:https://towardsdatascience.com/how-to-get-a-job-as-a-data-scientist-f417078fe13e
我也开始在我的LinkedIn上分享我的经历、想法和知识,这是非常重要的事情。我认识了很棒的人,这对我有很大帮助,现在我也在帮助别人。
LinkedIn地址:https://www.linkedin.com/in/faviovazquez/
每天我学习,代码,在开源项目中做贡献,并且帮助人们,所以我对我正在做的事情很满意。
深度学习呢?
等等,看到现在,你可能想问,这难道不是一个关于深度学习的帖子吗?
是的,但是我需要告诉你为什么现在的深度学习对我来说很重要。
作为一名数据科学家,你需要更新理论、技术和框架;因此,去年我们看到了深度学习的爆炸式增长,就在我对机器学习开始适应的时候,这是一个全新的学习方式。
但是,你知道我从哪里开始的吗?
是的!正是吴恩达的deeplearning.ai的学习课程。
deeplearning.ai学习地址:https://www.deeplearning.ai/
我真的对他感到惊讶。当我才开始接触这个领域时,他已经在教授这个领域的课程了。是的,我还在做这些课程。但我并没有就此止步。我也需要更多的实用信息。
于是我开始学习TensorFlow,然后是Keras。Keras是一个高级的神经网络API,用Python编写,能够在TensorFlow、CNTK或Theano上面运行。这是由François Chollet开发的,专注于快速的实验。能够从想法到结果,再到最少的延迟,是进行良好研究的关键。
有很好的学习实践深度学习的资源,比如GitHub的repos和一些相关书籍。现在我正在阅读《Deep Learning with Python》这本书,它对我的学习真的很有帮助:
注:这本书有中文版,AiTechYun截取了一些豆瓣网友对此书的评价。
深度学习的未来
预测是一种艺术,它告诉我们将要发生什么,然后解释它为什么没有发生。
我不知道如何预测未来。但我能说的是,我看到的是什么,就会发生什么。
我去年看到的深度学习的最好的东西之一就是Deep Cognition。这是创建和部署人工智能的一个解决方案。简单的拖放界面可以帮助你轻松地设计深度学习模型。Deep Learning Studio可以自动为你的自定义数据集设计一个深度学习模型,这要归功于他们的高级的AutoML功能。
Deep Cognition:http://deepcognition.ai/
我认为图形用户界面(GUI)和AutoML可以是深度学习的未来。不要误解我的意思,我喜欢编码,你也可以在那里编码。但我认为,我们明年编写的代码数量将会衰减。我们不可能花那么多的时间在全世界范围内编程相同的东西,所以我认为GUI和AutoML将帮助数据科学家提高效率和解决更多的问题。
先进制造业+工业互联网
产业智能官 AI-CPS
加入知识星球“产业智能研究院”:先进制造业OT(自动化+机器人+工艺+精益)和工业互联网IT(云计算+大数据+物联网+区块链+人工智能)产业智能化技术深度融合,在场景中构建“状态感知-实时分析-自主决策-精准执行-学习提升”的产业智能化平台;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
版权声明:产业智能官(ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。