赶紧收藏!西瓜书《机器学习》完整笔记来了

2019 年 8 月 24 日 大数据技术

来自:开源最前线(ID:OpenSourceTop) 


西瓜书《机器学习》是机器学习的必读书籍。 作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。 适合大学三年级以上的理工科本科生和研究生,以及具有类似背景的对机器学 习感兴趣的人士



虽然周志华教授已经尽可能少地使用数学知识,但是,还是没法避免必要的数学知识填充,基础较为薄弱的学生仍然觉得不好理解,这里猿妹和大家推荐一份《机器学习》的学习笔记—— Machine-learning-learning-notes


这份笔记出自一名叫Vay-keen的深圳大学学生,该笔记记录了其在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识。



目前,这份笔记已经在Github上获得 1421 个Star, 360 个Fork,共提交了 24 次commits(Github地址: https://github.com/Vay-keen/Machine-learning-learning-notes


笔记共分为17个部分,笔记的前一部分主要是对机器学习预备知识的概括,包括机器学习的定义/术语、学习器性能的评估/度量以及比较,之后将主要对具体的学习算法进行理解总结。



笔记详细到什么程序呢? 这里我们附上一小段笔记展示:


线性回归


回归就是通过输入的属性值得到一个预测值,利用上述广义线性模型的特征,是否可以通过一个联系函数,将预测值转化为离散值从而进行分类呢? 线性几率回归正是研究这样的问题。 对数几率引入了一个对数几率函数(logistic function),将预测值投影到0-1之间,从而将线性回归问题转化为二分类问题




若将y看做样本为正例的概率,(1-y)看做样本为反例的概率,则上式实际上使用线性回归模型的预测结果器逼近真实标记的对数几率。 因此这个模型称为“对数几率回归”(logistic regression),也有一些书籍称之为“逻辑回归”。 下面使用最大似然估计的方法来计算出w和b两个参数的取值,下面只列出求解的思路,不列出具体的计算过程






最常见的性能度量

在回归任务中,即预测连续值的问题,最常用的性能度量是“均方误差”(mean squared error),很多的经典算法都是采用了MSE作为评价函数,想必大家都十分熟悉。


在分类任务中,即预测离散值的问题,最常用的是错误率和精度,错误率是分类错误的样本数占样本总数的比例,精度则是分类正确的样本数占样本总数的比例,易知:错误率+精度=1。





●编号879,输入编号直达本文

●输入m获取文章目录

推荐↓↓↓

开源最前线

登录查看更多
29

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
吴恩达新书《Machine Learning Yearning》完整中文版
专知会员服务
145+阅读 · 2019年10月27日
机器学习笔试题精选
AI100
4+阅读 · 2018年7月20日
机器学习:从入门到绝不放弃!
图灵教育
5+阅读 · 2018年3月19日
线性回归:简单线性回归详解
专知
12+阅读 · 2018年3月10日
谷歌机器学习速成课学前预备书单
图灵教育
4+阅读 · 2018年3月2日
资源 |​ 史上最全机器学习笔记
AI100
9+阅读 · 2017年11月21日
推荐|一份不错的机器学习笔记!
全球人工智能
22+阅读 · 2017年11月20日
机器学习(23)之GBDT详解
机器学习算法与Python学习
12+阅读 · 2017年10月25日
机器学习(13)之最大熵模型详解
机器学习算法与Python学习
7+阅读 · 2017年8月24日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
4+阅读 · 2018年3月19日
Arxiv
4+阅读 · 2017年7月25日
VIP会员
相关VIP内容
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
吴恩达新书《Machine Learning Yearning》完整中文版
专知会员服务
145+阅读 · 2019年10月27日
相关资讯
机器学习笔试题精选
AI100
4+阅读 · 2018年7月20日
机器学习:从入门到绝不放弃!
图灵教育
5+阅读 · 2018年3月19日
线性回归:简单线性回归详解
专知
12+阅读 · 2018年3月10日
谷歌机器学习速成课学前预备书单
图灵教育
4+阅读 · 2018年3月2日
资源 |​ 史上最全机器学习笔记
AI100
9+阅读 · 2017年11月21日
推荐|一份不错的机器学习笔记!
全球人工智能
22+阅读 · 2017年11月20日
机器学习(23)之GBDT详解
机器学习算法与Python学习
12+阅读 · 2017年10月25日
机器学习(13)之最大熵模型详解
机器学习算法与Python学习
7+阅读 · 2017年8月24日
Top
微信扫码咨询专知VIP会员