春节充电系列:李宏毅2017机器学习课程学习笔记01之简介

2018 年 2 月 12 日 专知 专知内容组(编)

【导读】春节将近,在亲友相聚之余也不忘给自己充充电。为此,专知内容组给大家带来了台大李宏毅老师的2017年机器学习课程系列学习笔记。今天我们先来看一下该系列课程的内容简介。从本质上来讲,机器学习可以分为三部分:函数集(也就是model)、评价函数好坏的标准、训练集。该课程中机器学习的大致内容包括:有监督学习、无监督学习、半监督学习、回归、分类、迁移学习、结构化学习、强化学习。今天我们就来总览一下这些技术,并在后续的更新中跟大家一一介绍。


课件网址:

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

视频网址:

https://www.bilibili.com/video/av15889450/index_1.html

李宏毅机器学习笔记- Introduction


人工智能目前是非常热门的技术,人工智能在20世纪50年代已经出现,机器学习在20世纪80年代兴起,深度学习最近才火起来,其中人工智能是目标,机器学习是手段,深度学习是机器学习的一部分。


传统的计算机程序可以理解为人类设定好的天生本能,但它永远不会超过创造者


而机器学习则能够从已有的知识中学习到新的知识


其本质是从数据集中学习到一个函数,当你给这个函数一个输入,它就会有一个输出,这个输出就是人类想要的答案。函数f特别复杂,不可能通过人类推算出来,需要机器来学习


机器学习可以简单分为三个部分,第一个是函数集,也称为model,第二个为评价函数好坏的标准,用来选出最好的函数,第三个为训练集,帮助训练想要的函数。


所学习到的函数应该有举一反三的能力,即使训练集中没出现的东西,例如猫的图片,函数也应该给出一个结果。


机器学习的大体框架如下:


Supervised learning中的task和method在其他scenario也同样存在

supervised learning即监督学习,其典型特征为数据集有其标签,例如猫的图片标记着猫,狗的图片标记着狗。

regression即回归,从以往数据中总结经验,输出一个数值,一般用于预测任务,例如pm2.5的预测


Classification



classification即分类,分为binary classification和multi-class classification。Binary classification根据输入判断yes或者no,而multi-class classification相当于选择题,从多个类别选出一个答案


binary classification的典型例子为垃圾邮件的分类


multi-class classification的例子为文档分类

以上Supervised learning需要许多数据,我们可以采用别的方法减少数据量


Semi-supervised learning



半监督学习中,有许多没有label的数据集,这些没有label数据集对训练很有帮助

 

Transfer learning


 

迁移学习讲的一堆不相关的有label或者没label的图片,怎么对训练产生作用。例如炮姐(御坂美琴)的图片对于猫和狗的识别系统肯定不相关


Unsupervised learning


 

 无监督学习中的数据集都没有标签,相当于无师自通,只有input,没有output

例如机器可以浏览很多动物图片后然后自己画出一个新的动物图片(当然可能图片很奇怪)


Structured learning



Structured learning典型特点是输出有结构性的东西

Regression classification了解的是这个世界,structured learning学习的是世界外的暗黑大陆,有很多问题人们没有探究


Reinforcement learning



增强学习典型特征是从评价中学习,并不告诉机器怎么做,而是告诉机器这样做的对不对

典型的应用就是alpha go

最后总结一下机器学习大体框架


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),

  • 后台回复“LHY2017” 就可以获取 2017年李宏毅中文机器学习课程下载链接~

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

同时欢迎各位用户进行专知投稿,详情请点击

诚邀】专知诚挚邀请各位专业者加入AI创作者计划了解使用专知!

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知

登录查看更多
4

相关内容

李宏毅(Hung-yi Lee)目前任台湾大学电机工程学系和电机资讯学院的助理教授,他曾于 2012 年获得台湾大学博士学位,并于 2013 年赴麻省理工学院(MIT)计算机科学和人工智能实验室(CSAIL)做访问学者。他的研究方向主要是机器学习(深度学习)和语音识别。
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
一份简短《图神经网络GNN》笔记,入门小册
专知会员服务
224+阅读 · 2020年4月11日
专知会员服务
115+阅读 · 2019年12月24日
【机器学习课程】机器学习中的常识性问题
专知会员服务
73+阅读 · 2019年12月2日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
Arxiv
3+阅读 · 2019年9月5日
Logically-Constrained Reinforcement Learning
Arxiv
3+阅读 · 2018年12月6日
VIP会员
相关VIP内容
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
一份简短《图神经网络GNN》笔记,入门小册
专知会员服务
224+阅读 · 2020年4月11日
专知会员服务
115+阅读 · 2019年12月24日
【机器学习课程】机器学习中的常识性问题
专知会员服务
73+阅读 · 2019年12月2日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
Top
微信扫码咨询专知VIP会员