来源:全球人工智能
校对:洪舒越
本文共2200字,建议阅读6分钟。
本文给大家整理了下机器学习从入门到进阶的基本流程,主要侧重进阶部分。
一、机器学习入门必备知识
上图是人工智能与机器学习、深度学习的关系以及随时间发展的演化图。如今在工业界中,机器学习和深度学习都有着举足轻重的地位,二者解决的问题多有不同:机器学习擅长解决可结构化数据的分类预测问题,如房价预测、患病预测等;而深度学习更侧重非结构化数据的部分问题,如图片分类、文本分类等。
作为机器学习入门,当然是推荐课程和书籍,下面是想要入门机器学习的一些基本书籍和课程:
《数学之美》,作者吴军。这本书非常适合入门去看,讲的非常通俗,没有那种通篇上来就列一堆公式的情况,把这本书好好读读,你会发现算法是非常有意思的,能够解决很多问题。
《深入浅出数据分析》,这本书主要讲解数据分析的一些基本概念和知识,也适合入门阅读。
《MySQL必知必会》,这本书主要是讲解MySQL的,想要入门AI,基本的SQL还是要懂得。
《机器学习》,作者周志华,这本书可以说是机器学习入门的法宝,不但是入门书,并且值得你后期甚至大后期不断细细研读,入门必看,进阶同样重要。
《斯坦福大学公开课 :机器学习课程》,吴恩达大佬的斯坦福公开课,这也是入门课程,不过,这门课建议从入门到后期反复看,因为入门直接看可能完全看不懂,还是需要基本知识储备的。
其他课程:可以有选择的在直播平台上买一到两门课,从头到尾跟着老师学习,直接听上面的吴恩达大佬课程可能很难直接跟上,有一两门入门视频课还是能加快学习速度的,另外提一点就是,入门不需太多,但是最好买一门质量高的,这样一般会有老师答疑还可以有群很多人交流,不至于学着学着坚持不下去,坚持也是很重要的。
二、机器学习进阶必备知识
在有了上面学习的基本功底之后,就可以考虑进阶学习了,上面的入门知识可能要花费你3个月甚至更长的一些时间,但是无需过于纠结,上面搞不懂的问题,在进阶部分还可以继续研究。
机器学习进阶,所要学习的知识会开始偏向于具体算法和编程实践部分了,这部分建议不要贪多,可以采取各个知识点逐个突破的方法,各个算法挨个击破的办法,先给大家推荐几本靠谱的书籍:
《机器学习》,作者周志华。对,又是它,不要小看这本书,它会伴随你整个学习过程,这本书个人感觉并不是每个算法讲的都很好,对于算法各个击破,建议像决策树、随机森林、朴素贝叶斯和集成算法好好看看,这部分写的很好,像决策树,基本上按照它讲的,完全可以手工撸代码实现,很赞的。
《统计学习方法》,作者李航。这本书可以说是进阶利器,要想把机器学习里面的算法搞明白,这本书一定要好好读读,建议这本书里面的SVM、KNN算法好好看看,这本书讲的非常明白透彻,像SVM很多书省略很多步骤,讲的不够透彻。
《机器学习实战》,提着篮子背着锄头的那本书,这本书非常适合同时结合上面两本书一起看,个人认为是机器学习的“三剑客”,这三本书好好看看,跟着步骤撸点代码,了解的会更深入。
《利用python进行数据分析》,这本书非常重要,上面讲的是算法原理,要是真正将算法应用于实践,有相当大的一部分工作量是要对数据进行处理和分析的,机器学习中的数据多数都可以转化为DataFrame数据来进行建模,数据分析学会了,实际应用也就不远了,不过,关于数据分析,实践非常重要,只看书是不够的,这部分建议找一门课或者买一门课跟着学效果会好。
《Python自然语言处理》,这本书主要是讲自然语言处理的,也是一个比较重要的分支,有感兴趣的可以学一下。
《Neural Networks and Deep Learning》,作者 Michael Nielsen。这本书可以作为深度学习的入门和进阶,这本书要好好看看,讲的非常好,手把手教你深度学习。
deeplearning.ai ,作为机器深度学习的进阶课程,这也是一部利器视频,好好看看,能学不少东西。
其他课程:这部分需要学习的东西比入门多了很多,要想把这部分学好,需要花费大量的时间去看书,但是如果一直在看书,没有实践项目,会很难坚持下来,建议小伙伴们找一门从头到尾带你学习的课程,一边看书一边学,效果更佳。
三、机器学习学习方法
上面已经较为详细的列举了小白或者是有基本功的小伙伴学习机器学习的必备知识和课程,有了这些作为储备,你的硬件资源就够了,相当于有了教材和课件,但是学习有了这些东西是不够的,如何去学,如何高效的学以及步骤和侧重点也很重要,下面就给大家列举下学习过程中的一些问题。
1. 切勿掉入书山中,实践理论结合重要
在列举了上面的学习后,很多人可能会一头扎进书山中埋头苦读,读完一本接着一本最后发现什么都懂点什么又都没懂,这样效率是很低的,如果你是搞学术的不在此范围内,相信多数人还是偏应用,从事相关工作,在IT界,实践才能学到东西,不要一直看书,可以边看边试试写点代码,实现个小公式,小算法,这样进步快一些。
2. 采取并行学习法而非串行
这幅图可以作为学习的基本流程,但是未必需要前面具备才往后进行,可以一边学基础,一边写代码,一边还可以做比赛,这样可能前期痛苦些,但是后面会学得快。
3. 建立知识框架,修补知识漏洞
上面这幅图是sklearn的机器学习算法笔记,你可以在学习中去建立类似的笔记,有助于建立起整个学习框架,对于不懂的,再不断从细节去学。
4. 找到适合你的课程,跟着从头到尾学
如果你是上班族或者是在学校里面而没老师给你讲这门课,那么报一门适合你的课程从头到尾跟着学就非常重要了,不要过于相信你的自制力,没有人和你一起学,你学了很久也看不到自己有何进步,慢慢兴趣就没了,所以找到能从头到尾给你讲的课程也很重要,这个大家可以多对比多发现,总有一款适合你。
原文链接:https://www.toutiao.com/a6558305045509571076/