来源:Datawhale
有关机器学习的入门书籍非常多。但如果要说国内机器学习的入门经典作,相信很多人会脱口而出:非李航老师的《统计学习方法》和周志华老师的《机器学习》莫属。
周志华老师的《机器学习》,自2016年1月底出版以来,首印5000册一周售罄,并在8个月内重印9次,累计72000册。先后登上了亚马逊、京东、当当网等的计算机类畅销书榜首。就我了解,身边学习机器学习的小伙伴可谓是人手一本了。
如此经典的教材,相信大家买来也绝对不会让他待在书桌的角落。有人说西瓜书要读三遍,先通读建骨骼,再读提筋节,最后读通经络。那小伙伴在学习西瓜书的过程中,遇到最大的问题是什么呢?
公式推导!
读这本书时,你有没有那么一瞬间,有这种感觉,刚刚老师还在讲1+1,猛然一抬头发现:
那今天我们项目的主角《pumpkin-book》,提出这个项目的小哥哥有个理念,让天下没有难推的公式。
言归正传,南瓜书来源于西瓜书,由开源组织Datawhale发起,团队成员谢文睿牵头,带领6位成员,历时1个月,将西瓜书里公式进行了整理,对西瓜书中难点公式进行了详解,有跳跃性的公式进行了补充,于是有了《pumpkin-book》南瓜书项目。
周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节,诚挚欢迎每一位西瓜书读者前来参与完善本书:一个人可以走的很快,但是一群人却可以走的更远。
南瓜书是西瓜书的公式推导版,里面的内容都是以西瓜书的内容为前置知识进行表述,所以南瓜书的最佳使用方法:以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书。
若南瓜书里没有你想要查阅的公式,可以在issues区提交你希望补充推导或者解析的公式编号,我们看到后会尽快进行补充。
目前除了第15章外,已经完成了其余章节内容的梳理,后续内容更新完善中。文档采用Markdown语法编写,数学公式采用LaTeX语法编写,数学符号规范参见西瓜书目录前一页《主要符号表》。
《pumpkin-book》GitHub项目链接:
https://github.com/datawhalechina/pumpkin-book
在线阅读地址:
https://datawhalechina.github.io/pumpkin-book/
本文经授权转载自公众号Datawhale(ID:Datawhale)