资源 | 普通程序员如何自学机器学习?这里有一份指南~

2017 年 12 月 4 日 AI100 干货资源



机器学习工程师自学指南!


本文将会介绍机器学习的方方面面,从简单的线性回归到最新的神经网络,你不仅仅能学会如何使用它们,并且还能从零进行构建。


以下内容以计算机视觉为导向,这是学习一般知识的最快方法,并且你从中获得的经验可以很容易地迁移到机器学习的其他领域。


本文我们将会使用TensorFlow作为机器学习框架。


学习是一个多维因素作用的结果,所以如果能基于学习资料,理论和实践并重,学习效果会好很多。另外,还有一个很好的实践方法是参与Kaggle竞赛,通过竞赛的形式解决实际生活中的问题,从而巩固此前所学。


(要求:关于Python,你无需达到专家级别,但要很好地掌握基础知识)



1.课程


1.1  实用机器学习(约翰霍普金斯大学)

https://www.coursera.org/learn/practical-machine-learning


1.2  机器学习(斯坦福大学)

以上两个课程会教你一些数据科学和机器学习的基础知识,也有助于你对更有难度知识的学习和掌握。

https://www.coursera.org/learn/machine-learning


1.3 CS231n:面向视觉识别的卷积神经网络 2017 (2016)

该课程是网上关于ML & CV最好的课程之一,不仅能让你了解这里边的水有多深,还能为你进一步的研究探索打下良好的基础。

http://cs231n.stanford.edu/


1.4 深度学习(Udacity的课程)

https://www.udacity.com/course/deep-learning--ud730


1.5 CS224d:面向自然语言处理的深度学习

http://cs224d.stanford.edu/


1.6 深度学习相关的电子书(涵盖了ML的方方面面)

https://leonardoaraujosantos.gitbooks.io/artificial-inteligence/content/



2.实战


以下是课程和项目列表,有助于理解运行原理并找到提升办法。


2.1. Tensorflow 相关的简单练习课

https://www.kadenze.com/courses/creative-applications-of-deep-learning-with-tensorflow-iv/info


2.2. Tensorflow cookbook

https://github.com/nfmcclure/tensorflow_cookbook


2.3. Tensorflow-101教程部分

https://github.com/lengstrom/fast-style-transfer


2.4. 如何使用神经网络实现图像风格迁移。

https://github.com/lengstrom/fast-style-transfer


2.5 图像分割

https://github.com/MarvinTeichmann/tensorflow-fcn


2.6 使用SSD实现物体识别

https://github.com/balancap/SSD-Tensorflow


2.7 面向物体识别和分割的快速掩膜RCNN

https://github.com/CharlesShang/FastMaskRCNN


2.8 强化学习,对搭建一个机器人或者Dota AI非常有用。

https://github.com/dennybritz/reinforcement-learning


2.9 Google Brain团队的Magenta项目

https://github.com/tensorflow/magenta/tree/master/magenta/models


2.10 深度度双边学习实时图像增强

https://groups.csail.mit.edu/graphics/hdrnet/


2.11 自动驾驶汽车项目

https://github.com/udacity/self-driving-car



3. FAQ


学习过程中遇到困难怎么办?


首先,你必须明白机器学习不是100%精确的,大多数情况下只是一个很好的猜测并且需要大量的调整迭代。因此,在大多数情况下,想出一些独特的想法是非常困难的,因为你的时间和资源大多会花在训练模型上。所以不要试图独自找出解决方案,你可以搜索论文、项目以及找可以帮助你的人。可以说,在获得经验方面越快越好。


以下这些网站可以帮得到你:

  • http://www.gitxiv.com/

  • http://www.arxiv-sanity.com/

  • https://arxiv.org/, https://stackoverflow.com


为什么论文不能完全解决问题,或者在一些特定情况下为什么论文被验证是错的?


很遗憾的说,并不是所有的科技人员都愿意公开自己的研究成果,但他们需要通过发表论文来获得收益或者名望。所以他们中的一些人只公布了一部分材料,或者给出了错误的公式。所以我们最好搜索代码,而不是论文。论文只是解决了特定问题的证据或者事实。


从哪里查找最新的学习资料?

  • http://www.gitxiv.com/,不仅能找到最新论文,还能找到所需要的代码。

  • http://www.arxiv-sanity.com/

  • https://arxiv.org/


用云计算还是台式机/笔记本电脑?


在有大量计算需求的情况下,云计算是最好的选择。对于学习和测试,使用带有支持CUDA的显卡的PC/笔记本电脑要便宜得多。当然,如果你有免费云资源或多余资金,还是使用云比较好。


如何提高调超参数技能?

训练中的主要问题是时间,你不可能一直坐在那里盯着训练数据,因此建议你使用Grid Search。只需要创建一组超参数和模型架构,一个接一个的运行,并保存结果。这样你就能晚上训练,在接下来的一天对比结果,直至找到最有希望的那个。


你可以看看如何在sklearn库中完成这个操作:

http://scikit-learn.org/stable/modules/grid_search.html



作者 | Andrey Nikishaev

原文地址:

https://medium.com/machine-learning-world/learning-path-for-machine-learning-engineer-a7d5dc9de4a4




资源推荐


资源 | 想用Python学机器学习?Google大神替你写好了所有的编程示范代码

资源 | 亚马逊 AI 主任科学家李沐:动手学深度学习视频大全

资源 | Yann LeCun最新演讲:大脑是如何高效学习的?(附PPT+视频)

@那些想要转行AI的人:送你一份人工智能入门指南

资源 | 史上最全机器学习笔记

重磅 | 128篇论文,21大领域,深度学习最值得看的资源全在这了

爆款 | Medium上6900个赞的AI学习路线图,让你快速上手机器学习

Quora十大机器学习作者与Facebook十大机器学习、数据科学群组

Chatbot大牛推荐:AI、机器学习、深度学习必看9大入门视频

葵花宝典之机器学习:全网最重要的AI资源都在这里了(大牛,研究机构,视频,博客,书籍,Quora......)


☟☟☟ 更多学习资源,请戳原文

登录查看更多
9

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
171+阅读 · 2020年6月4日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
专知会员服务
115+阅读 · 2019年12月24日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
一文带你读懂计算机视觉
AI研习社
9+阅读 · 2018年12月10日
程序员精选:TensorFlow和ML前5名的课程
云栖社区
8+阅读 · 2018年8月27日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
11+阅读 · 2018年5月14日
Top 50机器学习项目实战总结
深度学习世界
5+阅读 · 2018年2月6日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
Arxiv
3+阅读 · 2019年9月5日
W-net: Bridged U-net for 2D Medical Image Segmentation
Arxiv
19+阅读 · 2018年7月12日
VIP会员
相关VIP内容
专知会员服务
171+阅读 · 2020年6月4日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
专知会员服务
115+阅读 · 2019年12月24日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
一文带你读懂计算机视觉
AI研习社
9+阅读 · 2018年12月10日
程序员精选:TensorFlow和ML前5名的课程
云栖社区
8+阅读 · 2018年8月27日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
11+阅读 · 2018年5月14日
Top 50机器学习项目实战总结
深度学习世界
5+阅读 · 2018年2月6日
资源 | 2017年GitHub中最为流行的30个开源机器学习项目
黑龙江大学自然语言处理实验室
3+阅读 · 2018年1月8日
Top
微信扫码咨询专知VIP会员