【导读】前一段时间,专知内容组推出了春节充电系列:李宏毅2017机器学习课程学习笔记,反响热烈,由此可见,大家对人工智能、机器学习的系列课程非常感兴趣,近期,专知内容组推出吴恩达老师的机器学习课程笔记系列,重温机器学习经典课程,希望大家会喜欢。
吴恩达机器学习课程系列视频链接:
http://study.163.com/course/courseMain.htm?courseId=1004570029
吴恩达课程学习笔记一:监督学习
监督学习
课程流程:
1、 举例引出监督学习
2、 给出关于regression(回归)以及classification(分类)的对比
3、 回顾课程内容,并给出一个小题目
1、举例:
房价预测:给定一个房子的尺寸,预测其售价(如下是一个示意图,它是根据已有的数据绘制的)
对于上述的图,我们可以利用一次或者二次函数去拟合price和size之间的关系。例如你有一个朋友拥有750size的房子,用两种方法拟合得出的price大约是150和200(这里是简单的在图上画两条函数线,然后找到750大约对应的price),这两种拟合的结果显然不同,后者预测的price高一些,但这两种拟合之一是否是最合适的拟合方法呢?预测的准确度又如何呢?
上面的例子就是监督学习的一个例子,什么是监督学习(supervised learning)?
监督学习:给算法一个数据集,数据集包含了正确的答案,如上的例子,在收集的数据集中,房子的size会对应着给定的price(这里的price就是正确的答案)。最终要实现的目的是对给定的数据进行预测,比如你为你朋友的房子做价格的预估。
2、Regression和Classification
对于上面提到的例子,它也是一个regression的例子,因为我们默认给定一个输入的值,输出的值是连续的值中的某一个(即房价某种意义上可以看做是连续的)
对于classification,给出下面这个例子:
对于肿瘤的预测问题:横轴是肿瘤大小,纵轴表示是否是恶性肿瘤(即纵轴是两个离散值,1表示是恶性肿瘤,0表示良性):
对于图的上半部分,画出了肿瘤大小与的肿瘤是否为恶性之间的关系,图的下半部分道理一样,只不过只有横轴,把肿瘤的良恶用圆圈和叉表示。
在上面的图中可以看出只利用一个特征去与肿瘤的良恶情况挂钩,当然我们可以有更多的特征,如把检测病人的年龄也作为一个特征,则采用圆圈和叉的方式更能直观的体现出两个特征与肿瘤良恶之间的关系(叉表示恶性),图如下:
我们把数据交给算法,对于上图,它可能做得是用一条直线来将恶性与良性区分开,如果有某一个人的年龄以及肿瘤大小位于图中的粉红色点位置,那么算法可能会给出结果说他是良性的。
例子中只给出了两种特征,但实际可以有更多,在处理实际问题中,给出的特征问往往不止两种(本题就可以增加例如肿瘤的厚度,肿瘤细胞大小的均匀性,肿瘤细胞形状的均匀性等特征)。其实我们可以设计算法去处理无穷多的特征。
以上讨论的是分类的一个例子,对于回归与分类,总结如下:
Regression解决的是预测连续值输出的问题,classification解决的是预测离散值输出的问题。
3、a small quiz
对于上图给定的两个预测问题,你会采用哪种学习算法呢?
问题一:你有同一件商品许多,你要预测接下来三个月的销售情况
问题二:你这里有许多客户的账户信息,你需要设计一种方法去检测客户的账号信息是否被入侵。
答案选择第三个
参考链接:
http://study.163.com/course/courseMain.htm?courseId=1004570029
-END-
专 · 知
人工智能领域主题知识资料查看获取:【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)
同时欢迎各位用户进行专知投稿,详情请点击:
【诚邀】专知诚挚邀请各位专业者加入AI创作者计划!了解使用专知!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!
请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
点击“阅读原文”,使用专知!