春节充电系列：李宏毅2017机器学习课程学习笔记02之Regression

2018 年 2 月 13 日 专知专知内容组（编）

【导读】我们在上一节的内容中已经为大家简介了台大李宏毅老师的机器学习课程内容，本节我们开始跟大家聊一聊其中的具体技术。今天我们要介绍的就是回归分析（regression），回归分析是机器学习重要的技术之一，被广泛应用于预测问题（如，股票市场预测、推荐系统等）。本文将主要介绍回归分析的问题，包括：损失函数、梯度下降、过拟合、正则化等。希望通过简明的介绍能让大家直观地掌握这些回归分析中最关键的问题。

春节充电系列：李宏毅2017机器学习课程学习笔记01之简介

课件网址：

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

视频网址：

https://www.bilibili.com/video/av15889450/index_1.html

李宏毅机器学习笔记—Regression

▌1．简介

Regression广泛应用于股票市场预测，自动驾驶汽车，推荐系统中

▌2. polemon进化后cp值预测

文中通过预测pokemon进化后的cp值来举例，进化后的cp值可能和许多因素有关

第一步为确定model，即函数集，根据pokemon固有的特征，建立方程来预测，线性方程有两个参数：w,b，我们最开始认为进化后的cp值只和进化前的cp值有关

文中给出了10组训练集，x即是pokemon，y为其进化后真实cp值

定义了一个loss function来评价该函数的好坏

通过minimize loss function，选出最佳的w,b来得到最好的函数

▌3.Gradient descent

因为loss function为可微分的函数，所以采用梯度下降法来得到最佳的w,b,注意到 Linear regression 没有local minimal.因为loss function是凸函数

通过loss function分别对w，b做偏微分，我们可以得到

于是我们得到最终的结果，损失函数值为31.9

用test data进行验证，得到loss function的值为35.0，大于在训练集的错误率

貌似不是很理想，再试图用更复杂的函数试试，即二次函数，结果显示更好

再试试三次函数，结果比二次函数更好

再试试4次函数，令人惊讶的是training error比以前更小，但testing erro比以前更大

五次函数就更糟糕了

▌4. Overfitting

这一切的原因是overfitting，因为参数过多，导致函数能够完美拟合训练集，但对于测试集就差别很大了。

之前我们只考虑了进化前的cp值，但进化后的cp值可能和其他因素有关，可能都需要考虑，但无脑讲所有因素加入其中极有可能overfitting。

▌5. Regularization

为了解决这个问题，我们采用regularizaition的方法，目的是为了得到更平滑的loss function，即让w的值变小，使得loss function受x的影响小，具体形式如下图所示

从下图可以看出，入越大，training data error越大，越倾向于考虑入本来的值，更少考虑error。

入越大，test data可能比较小，我们喜欢比较平滑的function，但不喜欢太平滑的function，比如水平线，什么都干不成。

于是我们需要调参数，注意regularizaiton不需要考虑b，b和函数平滑无关。

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知），

后台回复“LHY2017” 就可以获取 2017年李宏毅中文机器学习课程下载链接~

-END-

专 · 知

人工智能领域主题知识资料查看获取：【专知荟萃】人工智能领域26个主题知识资料全集（入门/进阶/论文/综述/视频/专家等）

同时欢迎各位用户进行专知投稿，详情请点击：

【诚邀】专知诚挚邀请各位专业者加入AI创作者计划！了解使用专知！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请扫一扫如下二维码关注我们的公众号，获取人工智能的专业知识！

请加专知小助手微信（Rancho_Fang），加入专知主题人工智能群交流！

点击“阅读原文”，使用专知！

登录查看更多

相关内容

李宏毅

关注 18

李宏毅（Hung-yi Lee）目前任台湾大学电机工程学系和电机资讯学院的助理教授，他曾于 2012 年获得台湾大学博士学位，并于 2013 年赴麻省理工学院（MIT）计算机科学和人工智能实验室（CSAIL）做访问学者。他的研究方向主要是机器学习（深度学习）和语音识别。

【硬核课】最新《深度学习优化问题》教程，78页ppt，台大林智仁教授讲解

专知会员服务

150+阅读 · 2020年5月29日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

普渡大学2020硬核课程《鲁棒机器学习理论》课件与笔记，38讲173页pdf

专知会员服务

180+阅读 · 2020年3月28日

【CVPR2020】视觉跟踪的概率回归，Probabilistic Regression for Visual Tracking

专知会员服务

37+阅读 · 2020年3月27日

【Texas 大学】强化学习领域的课程学习:一个框架和综述

专知会员服务

73+阅读 · 2020年3月22日

李宏毅《机器学习2020版》正式开放上线：带你进行ML打怪升级！

专知会员服务

111+阅读 · 2020年3月7日

台湾大学林轩田机器学习书籍《从数据中学习》，216页pdf

专知会员服务

172+阅读 · 2020年3月6日

【2019机器学习大总结】机器学习和机器人:我的2019年领域状态

专知会员服务

54+阅读 · 2019年12月31日

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

专知会员服务

84+阅读 · 2019年10月29日

春节充电系列：李宏毅2017机器学习课程学习笔记16之无监督学习：自编码器（autoencoder）

专知

6+阅读 · 2018年3月2日

春节充电系列：李宏毅2017机器学习课程学习笔记15之无监督学习：Neighbor Embedding

专知

3+阅读 · 2018年3月1日

春节充电系列：李宏毅2017机器学习笔记14之无监督学习：词嵌入表示（Word Embedding）

专知

5+阅读 · 2018年2月28日

春节充电系列：李宏毅2017机器学习课程学习笔记12之半监督学习（Semi-supervised Learning）

专知

6+阅读 · 2018年2月26日

春节充电系列：李宏毅2017机器学习课程学习笔记11之Why Deep Learning?

专知

3+阅读 · 2018年2月25日

春节充电系列：李宏毅2017机器学习课程学习笔记10之卷积神经网络

专知

4+阅读 · 2018年2月24日

春节充电系列：李宏毅2017机器学习课程学习笔记06之深度学习入门

专知

9+阅读 · 2018年2月19日

春节充电系列：李宏毅2017机器学习课程学习笔记05之Logistic 回归

专知

5+阅读 · 2018年2月18日

春节充电系列：李宏毅2017机器学习课程学习笔记04之分类（Classification）

专知

4+阅读 · 2018年2月16日

春节充电系列：李宏毅2017机器学习课程学习笔记01之简介

专知

4+阅读 · 2018年2月12日

NEAR: Neighborhood Edge AggregatoR for Graph Classification

Arxiv

5+阅读 · 2019年9月6日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

Arxiv

4+阅读 · 2019年4月15日

Foreground-aware Image Inpainting

Arxiv

4+阅读 · 2019年1月17日

Multi-class Classification without Multi-class Labels

Arxiv

4+阅读 · 2019年1月2日

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

SEARNN: Training RNNs with Global-Local Losses

Arxiv

5+阅读 · 2018年1月29日

Subset Labeled LDA for Large-Scale Multi-Label Classification

Arxiv

3+阅读 · 2017年9月16日

Dr.VAE: Drug Response Variational Autoencoder

Arxiv

3+阅读 · 2017年7月6日

VIP会员