从事数据科学方面的工作时,活用各种相关函式库、软体框架、模组、工具包是很好的做法,但如果原本完全不懂数据科学,从头开始也是一种不错的做法。本书将采取土法炼钢从头学起的方式,带领读者认识与数据科学相关的许多工具与演算法。
你只要具备基本的数学能力,以及程式设计的基础,本书就可以帮你在遇到相关的数学与统计知识时,不至于感到害怕,而且还能让你学会一个数据科学家所需具备的相关骇客技术。如今到处充斥着各种杂乱的数据资料,其中包含许多问题的解答,但也有很多微妙之处,甚至连问题本身都还没被提出来过。如果你真心想要挖掘问题的解答,本书将可以提供你一些相关的知识。
首先来一堂Python速成班 学习线性代数、统计、机率的基础知识——并学会何时、如何在数据科学领域中灵活运用这些知识 搜集、探索、清理、转换、处理各种数据资料
深入理解机器学习的基础 灵活运用像是k最近邻、单纯贝氏、线性与逻辑回归、决策树、神经网路、集群等种种模型
探讨推荐系统、自然语言处理、网路分析、MapReduce与数据库的相关知识
名人推荐 「Joel带领我们领略探索数据科学,让我们从一般的好奇心,进入到更深入的理解,并学会所有资料科学家都应该知道的各种实用演算法。」 ——Rohit Sivaprasad, Soylent公司数据科学家
【Table of Contents】目录/大纲/内容概要
第1章简介
第2章Python速成班
第3章数据视觉化
第4章线性代数
第5章统计学
第6章机率
第7章假设与推论
第8章梯度递减
第9章取得数据资料
第10章处理数据资料
第11章机器学习
第12章k最近邻
第13章单纯贝氏
第14章简单线性回归
第15章多元回归
第16章逻辑回归
第17章决策树
第18章神经网路
第19章集群
第20章自然语言处理
第21章网路分析
第22章推荐系统
第23章资料库与SQL
第24章MapReduce
第25章勇往直前,数据科学做就对了