机器学习是计算机科学的一个子领域,让计算机能够在没有明确编码的情况下自动进行学习。机器学习学科的目的是研究和构建一些可以让机器自动从数据中学习和基于数据进行预测的算法。
机器学习的范围很广泛,令人着迷。它跨越数学,计算机科学和神经科学的多个领域。
本文的目的主要是尝试总结机器学习相关的一些“过程”、数据处理过程、数学理论和常用模型。
1、过程
数据科学不是一个设定然后遗忘的过程,而是一个需要设计、实现和维护的过程。
下面这张图包含有关机器学习过程相关的内容,描述了机器学习数据准备、模型选择、损失函数选择、优化、参数调整和结果对比分析过程。
2、数据处理
首先,我们需要一些数据。数据处理包括寻找、收集、清理、还有其他操作等5个步骤。下图展示了这些内容。
3、数学基础
机器学习建立在数学基础之上。下图展示了机器学习相关的常见的数学基础知识,可以参考,检查你是否遗漏了某些知识点。
4、概念
下图展示了机器学习相关的部分种类,类别,方式,库和方法相关的概念,涉及线性代数、统计、概率、优化、正则、信息论、极大似然估计、分布和损失函数等方面。
5、模型
下图列举了一些机器学习常见的模型,主要介绍了神经网络和传统机器去学习算法两部分。神经网络部分主要介绍输入层、隐含层、权值初始化、反向传播法、总结常用的激活函数(Relu,Sigmoid,Binary,Tanh,Softplus等)。传统机器学习主要介绍一些分类、回归、降维和基于贝叶斯和决策树、和基于实例的机器学习算法。
回复:思维导图 获得Python学习必备思维导图电子版
回复:量化交易 获得量化投资编程课程与资料
回复:实验 获得20+开源小实验,真枪实战体验AI之趣
回复:BAT 获得BAT机器学习往期面试题
回复:题库 获得人工智能面试题库!