春节充电系列：李宏毅2017机器学习课程学习笔记04之分类（Classification）

2018 年 2 月 16 日 专知专知内容组（编）

【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的梯度下降问题，一步步讲解了梯度下降的若干主要问题：调整学习率、随机梯度下降、feature scaling、以及如何直观的理解梯度下降。这一节主要介绍常见的分类问题（Classification），本文内容涉及机器学习中分类问题的几个主要问题：分类的定义、分类的回归模型等价、分类的概率模型、示例说明。话不多说，让我们一起学习这些内容吧。

春节充电系列：李宏毅2017机器学习课程学习笔记01之简介

春节充电系列：李宏毅2017机器学习课程学习笔记02之Regression

春节充电系列：李宏毅2017机器学习课程学习笔记03之梯度下降

课件网址：

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

视频网址：

https://www.bilibili.com/video/av15889450/index_1.html

李宏毅机器学习笔记 4 Classification

分类问题可以应用在很多领域，例如信用评分，医疗诊断，手写数字辨识，面部识别等领域。

以pokemon的类型辨识作为例子解释分类问题，pokemon有很多类型，比如火系，水系，电系等。

我们可以根据pokemon一系列特征，来解决分类问题

分类问题当作回归问题

如果分类问题当作一个回归问题解决，以二分类作为例子，给定一系列数据集，这些数据集有标签，其中我们可以让1表示class1,-1表示class2。

理想情况下如下图左边所示，貌似当做回归问题解决可以很好解决分类问题。但当碰到那些过于“正确”的例子时，会发生下图右边的情况，这时候分类效果并不理想

分类问题当作概率模型

于是我们可以尝试使用概率的模型来解决分类问题。例如我们知道类别1，类别2的概率，知道已知类别1情况下blue的概率，知道已知类别2情况下blue的概率，于是我们可以推得已知blue情况下为类别1的概率。

举例

下面用具体的例子来计算说明

已知water类pokemon有79只，normal类pokemon有61只，我们可以得到其类别的概率。

我们用一个向量来表示一个pokemon的属性

Water类的79只pokemon向量表示我们已经知道

我们假设其分布服从高斯分布，利用最大似然估计，我们可以轻易得到求高斯分布均值和方差的公式。

最后将算出的概率汇总，利用之前的公式，得到x是class1的概率，当这个概率大于0.5时我们认为其属于class1。

最终得到如下结果。

为了有效减少参数，可以让两个模型用同样的协方差矩阵

μ1和μ2算法和以前一样

我们观察实验结果，可以发现当两个高斯分布协方差矩阵相同时，class的边界是线性函数

并且正确率大为提高

我们来稍微改变一下前面的条件概率公式，可以得到sigmoid function

然后对sigmoid的z进行化简

当两个高斯分布的协方差矩阵相同时我们可以继续化简得到

从上图我们可以明白为什么当两个高斯分布的协方差矩阵相同时其class的边界为线性函数。

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知），

后台回复“LHY2017” 就可以获取 2017年李宏毅中文机器学习课程下载链接~

-END-

专 · 知

人工智能领域主题知识资料查看获取：【专知荟萃】人工智能领域26个主题知识资料全集（入门/进阶/论文/综述/视频/专家等）

同时欢迎各位用户进行专知投稿，详情请点击：

【诚邀】专知诚挚邀请各位专业者加入AI创作者计划！了解使用专知！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请扫一扫如下二维码关注我们的公众号，获取人工智能的专业知识！

请加专知小助手微信（Rancho_Fang），加入专知主题人工智能群交流！

点击“阅读原文”，使用专知！

登录查看更多

相关内容

李宏毅

关注 18

李宏毅（Hung-yi Lee）目前任台湾大学电机工程学系和电机资讯学院的助理教授，他曾于 2012 年获得台湾大学博士学位，并于 2013 年赴麻省理工学院（MIT）计算机科学和人工智能实验室（CSAIL）做访问学者。他的研究方向主要是机器学习（深度学习）和语音识别。

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

干货书《数据科学数学系基础》2020最新版，266页pdf

专知会员服务

322+阅读 · 2020年3月23日

【Texas 大学】强化学习领域的课程学习:一个框架和综述

专知会员服务

72+阅读 · 2020年3月22日

二值分类熵界分析—国科大UCAS胡包钢教授《信息论与机器学习》课程第五讲

专知会员服务

52+阅读 · 2020年3月16日

李宏毅《机器学习2020版》正式开放上线：带你进行ML打怪升级！

专知会员服务

111+阅读 · 2020年3月7日

【干货】监督学习知识手册大全|维基百科书，附103页pdf下载

专知会员服务

69+阅读 · 2019年12月5日

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

专知会员服务

84+阅读 · 2019年10月29日

春节充电系列：李宏毅2017机器学习课程学习笔记19之迁移学习（Transfer Learning）

专知

9+阅读 · 2018年3月5日

春节充电系列：李宏毅2017机器学习课程学习笔记16之无监督学习：自编码器（autoencoder）

专知

6+阅读 · 2018年3月2日

春节充电系列：李宏毅2017机器学习课程学习笔记15之无监督学习：Neighbor Embedding

专知

3+阅读 · 2018年3月1日

春节充电系列：李宏毅2017机器学习笔记14之无监督学习：词嵌入表示（Word Embedding）

专知

5+阅读 · 2018年2月28日

春节充电系列：李宏毅2017机器学习课程学习笔记11之Why Deep Learning?

专知

3+阅读 · 2018年2月25日

春节充电系列：李宏毅2017机器学习课程学习笔记10之卷积神经网络

专知

4+阅读 · 2018年2月24日

春节充电系列：李宏毅2017机器学习课程学习笔记06之深度学习入门

专知

9+阅读 · 2018年2月19日

春节充电系列：李宏毅2017机器学习课程学习笔记05之Logistic 回归

专知

5+阅读 · 2018年2月18日

春节充电系列：李宏毅2017机器学习课程学习笔记02之Regression

专知

3+阅读 · 2018年2月13日

春节充电系列：李宏毅2017机器学习课程学习笔记01之简介

专知

4+阅读 · 2018年2月12日

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

Arxiv

10+阅读 · 2019年9月15日

S4Net: Single Stage Salient-Instance Segmentation

Arxiv

10+阅读 · 2019年4月10日

Multi-class Classification without Multi-class Labels

Arxiv

4+阅读 · 2019年1月2日

LNEMLC: Label Network Embeddings for Multi-Label Classification

Arxiv

4+阅读 · 2019年1月1日

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

Complex Network Classification with Convolutional Neural Network

Arxiv

6+阅读 · 2018年4月8日

Combination of Hidden Markov Random Field and Conjugate Gradient for Brain Image Segmentation

Arxiv

8+阅读 · 2018年3月13日

Classification of sparsely labeled spatio-temporal data through semi-supervised adversarial learning

Arxiv

6+阅读 · 2018年1月29日

Subset Labeled LDA for Large-Scale Multi-Label Classification

Arxiv

3+阅读 · 2017年9月16日

VIP会员