如果您不熟悉基础知识,则机器学习可能是一个困难的主题。借助本书,您将获得统计编程语言R在机器学习中使用的入门原则的坚实基础。您将从回归等基础知识开始,然后进入神经网络等更高级的主题,最后深入研究像Caret这样的软件包在R世界中机器学习的前沿。

通过熟悉诸如理解回归模型和分类模型之间的差异之类的主题,您将能够解决一系列机器学习问题。知道何时使用特定模型可能意味着高精度模型与完全无用的模型之间的区别。本书提供了大量示例来构建机器学习的实用知识。

了解机器学习算法的主要部分: 认识到如何使用机器学习以简单的方式解决问题 找出何时使用某些机器学习算法与其他算法 了解如何使用最先进的软件包实施算法

成为VIP会员查看完整内容
0
31

相关内容

本书是信息论领域中一本简明易懂的教材。主要内容包括:熵、信源、信道容量、率失真、数据压缩与编码理论和复杂度理论等方面的介绍。

本书还对网络信息论和假设检验等进行了介绍,并且以赛马模型为出发点,将对证券市场研究纳入了信息论的框架,从新的视角给投资组合的研究带来了全新的投资理念和研究技巧。

本书适合作为电子工程、统计学以及电信方面的高年级本科生和研究生的信息论基础教程教材,也可供研究人员和专业人士参考。

本书是一本简明易懂的信息论教材。正如爱因斯坦所说:“凡事应该尽可能使其简单到不能再简单为止。''虽然我们没有深人考证过该引语的来源(据说最初是在幸运蛋卷中发现的),但我们自始至终都将这种观点贯穿到本书的写作中。信息论中的确有这样一些关键的思想和技巧,一旦掌握了它们、不仅使信息论的主题简明,而且在处理新问題时提供重要的直觉。本书来自使用了十多年的信息论讲义,原讲义是信息论课程的高年级本科生和一年级研究生两学期用的教材。本书打算作为通信理论.计算机科学和统计学专业学生学习信息论的教材。

信息论中有两个简明要点。第一,熵与互信息这样的特殊量是为了解答基本问题而产生的。例如,熵是随机变量的最小描述复杂度,互信息是度量在噪声背景下的通信速率。另外,我们在以后还会提到,互信息相当于已知边信息条件下财富双倍的增长。第二,回答信息理论问邀的答案具有自然的代数结构。例如,熵具有链式法则,因而,谪和互信息也是相关的。因此,数据压缩和通信中的问题得到广泛的解释。我们都有这样的感受,当研究某个问题时,往往历经大量的代数运算推理得到了结果,但此时没有真正了解问题的全莪,最终是通过反复观察结果,才对整个问题有完整、明确的认识。所以,对一个问题的全面理解,不是靠推理,而是靠对结果的观察。要更具体地说明这一点,物理学中的牛顿三大定律和薛定谔波动方程也许是最合适的例子。谁曾预见过薛定谔波动方程后来会有如此令人敬畏的哲学解释呢?

在本书中,我们常会在着眼于问题之前,先了解一下答案的性质。比如第2章中,我们定义熵、相对熵和互信息,研究它们之间的关系,再对这些关系作一点解释·由此揭示如何融会贯通地使用各式各样的方法解决实际问题。同理,我们顺便探讨热力学第二定律的含义。熵总是增加吗?答案既肯定也否定。这种结果会令专家感兴趣,但初学者或i午认为这是必然的而不会深人考虑。

在实际教学中.教师往往会加人一自己的见解。事实上,寻找无人知道的证明或者有所创新的结果是一件很愉快的事情。如果有人将新的思想和已经证明的内容在课堂上讲解给学生,那么不仅学生会积极反馈“对,对,对六而且会大大地提升教授该课程的乐崆我们正是这样从研究本教材的许多新想法中获得乐趣的。

本书加人的新素材实例包括信息论与博弈之间的关系,马尔可夫链背景下热力学第二定律的普遍性问题,信道容量定理的联合典型性证明,赫夫曼码的竞争最优性,以及关于最大熵谱密度估计的伯格(回定理的证明。科尔莫戈罗夫复杂度这一章也是本书的独到之处。面将费希尔信息,互信息、中心极限定理以及布伦一闵可夫斯基不等式与熵幂不等式联系在一起,也是我们引以为豪之处。令我们感到惊讶的是.关于行列式不等式的许多经典结论,当利用信息论不等式后会很容易得到证明。

自从香农的奠基性论文面世以来,尽管信息论已有了相当大的发展,但我们还是要努力强调它的连贯性。虽然香农创立信息论时受到通信理论中的问题启发,然而我们认为信息论是一门独立的学科,可应用于通信理论和统计学中。我们将信息论作为一个学科领域从通信理论、概率论和统计学的背景中独立出来因为明显不可能从这些学科中获得难以理解的信息概念。由于本书中绝大多数结论以定理和证明的形式给出,所以,我们期望通过对这些定理的巧妙证明能说明这些结论的完美性。一般来讲,我们在介绍问题之前先描述回题的解的性质,而这些很有的性质会使接下来的证明顺理成章。

使用不等式串、中间不加任何文字、最后直接加以解释,是我们在表述方式上的一项创新希望读者学习我们所给的证明过程达到一定数量时,在没有任何解释的情况下就能理解其中的大部分步,并自己给出所需的解释这些不等式串好比模拟到试题,读者可以通过它们确认自己是否已掌握证明那些重要定理的必备知识。这些证明过程的自然流程是如此引人注目,以至于导致我们轻视了写作技巧中的某条重要原则。由于没有多余的话,因而突出了思路的逻辑性与主題思想u我们希望当读者阅读完本书后,能够与我们共同分亨我们所推崇的,具有优美、简洁和自然风格的信息论。

本书广泛使用弱的典型序列的方法,此概念可以追溯到香农1948年的创造性工作,而它真正得到发展是在20世纪70年代初期。其中的主要思想就是所谓的渐近均分性(AEP),或许可以粗略地说成“几乎一切事情都是等可能的"

第2章阐述了熵、相对熵和互信息之同的基本代数关系。渐近均分性是第3章重中之重的内容,这也使我们将随机过程和数据压缩的熵率分别放在第4章和第5章中论述。第6章介绍博弈,研究了数据压缩的对偶性和财富的增长率。可作为对信息论进行理性思考基础的科尔莫戈罗夫复杂度,拥有着巨大的成果,放在第14章中论述。我们的目标是寻找一个通用的最矩描述,而不是平均意义下的次佳描述。的确存在这样的普遍性概念用来刻画一个对象的复杂度。该章也论述了神奇数0,揭示数学上的不少奥秘,是图灵机停止运转概率的推广。第7章论述信道容量定理。第8章叙述微分熵的必需知识,它们是将早期容量定理推广到连续噪声信道的基础。基本的高斯信道容量问题在第9章中论述。第il章阐述信息论和统计学之间的关系,20世纪年代初期库尔贝克首次对此进行了研究,此后相对被忽视。由于率失真理论比无噪声数据压缩理论需要更多的背景知识,因而将其放置在正文中比较靠后的第10章。

网络信息理论是个大的主题,安排在第巧章,主要研究的是噪声和干扰存在情形下的同时可达的信息流。有许多新的思想在网络信息理论中开始活跃起来,其主要新要素有干扰和反馈第16章讲述股票市场,这是第6章所讨论的博弈的推广,也再次表明了信息论和博弈之间的紧密联系。第17章讲述信息论中的不等式,我们借此一隅把散布于全书中的有趣不等式重新收拢在一个新的框架中,再加上一些关于随机抽取子集熵率的有趣新不等式。集合和的体积的布伦一闵可夫斯基不等式,独立随机变量之和的有效方差的熵幂不等式以及费希尔信息不等式之间的美妙关系也将在此章中得到详尽的阐述。

本书力求推理严密,因此对数学的要求相当高·要求读者至少学过一学期的概率论课程且有扎实的数学背景,大致为本科高年级或研究生一年级水平。尽管如此,我们还是努力避免使用测度论。因为了解它只对第16章中的遍历过程的AEP的证明过程起到简化作用。这符合我们的观点,那就是信息论基础与技巧不同,后者才需要将所有推广都写进去。

本书的主体是第2,3,4,5,7,8,9,10,11和巧章,它们自成体系,读懂了它们就可以对信息论有很好的理解。但在我们看来,第14章的科尔莫戈罗夫复杂度是深人理解信息论所需的必备知识。余下的几章,从博弈到不等式.目的是使主题更加连贯和完美。

成为VIP会员查看完整内容
0
114

这本书的书名听起来有点神秘。如果这本书以一种错误的方式呈现了这个主题,人们为什么要读它呢?书中哪些地方做得特别“不对”?

在回答这些问题之前,让我先描述一下本文的目标受众。这本书是“荣誉线性代数”课程的课堂讲稿。这应该是高等数学学生的第一门线性代数课程。它的目标是一个学生,虽然还不是非常熟悉抽象推理,但愿意学习更严格的数学,在“烹饪书风格”的微积分类型课程。除了作为线性代数的第一门课程,它也应该是第一门向学生介绍严格证明、形式定义——简而言之,现代理论(抽象)数学风格的课程。

目标读者解释了基本概念和具体实例的非常具体的混合,它们通常出现在介绍性的线性代数文本中,具有更抽象的定义和高级书籍的典型构造。

https://www.math.brown.edu/streil/papers/LADW/LADW_2017-09-04.pdf

成为VIP会员查看完整内容
0
62

学习使用Python分析数据和预测结果的更简单和更有效的方法

Python机器学习教程展示了通过关注两个核心机器学习算法家族来成功分析数据,本书能够提供工作机制的完整描述,以及使用特定的、可破解的代码来说明机制的示例。算法用简单的术语解释,没有复杂的数学,并使用Python应用,指导算法选择,数据准备,并在实践中使用训练过的模型。您将学习一套核心的Python编程技术,各种构建预测模型的方法,以及如何测量每个模型的性能,以确保使用正确的模型。关于线性回归和集成方法的章节深入研究了每种算法,你可以使用书中的示例代码来开发你自己的数据分析解决方案。

机器学习算法是数据分析和可视化的核心。在过去,这些方法需要深厚的数学和统计学背景,通常需要结合专门的R编程语言。这本书演示了机器学习可以如何实现使用更广泛的使用和可访问的Python编程语言。

使用线性和集成算法族预测结果

建立可以解决一系列简单和复杂问题的预测模型

使用Python应用核心机器学习算法

直接使用示例代码构建自定义解决方案

机器学习不需要复杂和高度专业化。Python使用了更简单、有效和经过良好测试的方法,使这项技术更容易为更广泛的受众所接受。Python中的机器学习将向您展示如何做到这一点,而不需要广泛的数学或统计背景。

成为VIP会员查看完整内容
0
131

获得金融、医疗保健和零售领域的机器学习实用技能。这本书通过提供这些领域的案例研究,使用了动手的方法:你将看到如何使用机器学习作为商业增强工具的例子。作为一名领域专家,您不仅会发现机器学习在金融、医疗保健和零售领域是如何应用的,而且还会通过实施机器学习的实际案例研究进行工作。

使用Python的机器学习应用程序分为三个部分,分别针对每个领域(医疗保健、金融和零售)。每一节都以机器学习和该领域的关键技术进展的概述开始。然后,您将通过案例研究了解更多关于组织如何改变其所选择市场的游戏规则。这本书有实际的案例研究与Python代码和领域特定的创新想法赚钱的机器学习。

你会学到什么

  • 发现应用的机器学习过程和原理
  • 在医疗保健、金融和零售领域实现机器学习
  • 避免应用机器学习的陷阱
  • 在三个主题领域构建Python机器学习示例

这本书是给谁的

  • 数据科学家和机器学习专家。
成为VIP会员查看完整内容
0
87

Graph Data Science For Dummies将带您了解图数据科学的基础——从定义图分析和算法到向您展示如何使用它们进行机器学习和解决现实世界的问题。

  • 了解图表数据科学基础

  • 用图表分析做出更好的预测

  • 使用GDS技术升级您的应用程序

https://neo4j.com/graph-data-science-for-dummies/

成为VIP会员查看完整内容
0
63

来自UIUC的机器学习书稿,讲述机器学习基础知识,包含回归、分类、聚类等

成为VIP会员查看完整内容
0
49

随着机器学习越来越多地被用于发现模式、进行分析和做出决策——投资于吸引更多的利益相关者加入是至关重要的。这本关于机器学习中的Python项目的书试图做到这一点:为今天和明天的开发人员提供工具,他们可以使用这些工具更好地理解、评估和塑造机器学习,以帮助确保它为我们所有人服务。

如果你还没有Python编程环境,这本书将为你提供一个,然后在“机器学习导论”一章中为你提供一个机器学习的概念理解。接下来是三个Python机器学习项目。它们将帮助你创建一个机器学习分类器,建立一个神经网络来识别手写数字,并通过为Atari构建一个机器人来给你一个深度强化学习的背景知识。

Python机器学习项目

  1. 前言
  2. 设置Python编程环境 3.机器学习入门
  3. 如何用Scikitlearn在Python中构建机器学习分类器
  4. 如何建立基于Tensorflow的神经网络识别手写数字
  5. 深度强化学习的偏差-方差: 如何用OpenAI Gym为Atari构建一个机器人

成为VIP会员查看完整内容
0
101

本书涵盖了这些领域中使用Python模块演示的概率、统计和机器学习的关键思想。整本书包括所有的图形和数值结果,都可以使用Python代码及其相关的Jupyter/IPython Notebooks。作者通过使用多种分析方法和Python代码的有意义的示例,开发了机器学习中的关键直觉,从而将理论概念与具体实现联系起来。现代Python模块(如panda、y和Scikit-learn)用于模拟和可视化重要的机器学习概念,如偏差/方差权衡、交叉验证和正则化。许多抽象的数学思想,如概率论中的收敛性,都得到了发展,并用数值例子加以说明。本书适合任何具有概率、统计或机器学习的本科生,以及具有Python编程的基本知识的人。

成为VIP会员查看完整内容
0
154

高斯过程(GPs)为核机器的学习提供了一种有原则的、实用的、概率的方法。在过去的十年中,GPs在机器学习社区中得到了越来越多的关注,这本书提供了GPs在机器学习中理论和实践方面长期需要的系统和统一的处理。该书是全面和独立的,针对研究人员和学生在机器学习和应用统计学。

这本书处理监督学习问题的回归和分类,并包括详细的算法。提出了各种协方差(核)函数,并讨论了它们的性质。从贝叶斯和经典的角度讨论了模型选择。讨论了许多与其他著名技术的联系,包括支持向量机、神经网络、正则化网络、相关向量机等。讨论了包括学习曲线和PAC-Bayesian框架在内的理论问题,并讨论了几种用于大数据集学习的近似方法。这本书包含说明性的例子和练习,和代码和数据集在网上是可得到的。附录提供了数学背景和高斯马尔可夫过程的讨论。

成为VIP会员查看完整内容
0
123

这本书在对算法工作原理的高层次理解和对优化模型的具体细节的了解之间找到一个平衡点。这本书将给你的信心和技能时,开发所有主要的机器学习模型。在这本Pro机器学习算法中,您将首先在Excel中开发算法,以便在用Python/R实现模型之前,实际了解可以在模型中调优的所有细节。

你将涵盖所有主要的算法:监督和非监督学习,其中包括线性/逻辑回归;k - means聚类;主成分分析;推荐系统;决策树;随机森林;“GBM”;和神经网络。您还将通过CNNs、RNNs和word2vec等文本挖掘工具了解最新的深度学习。你不仅要学习算法,还要学习特征工程的概念来最大化模型的性能。您将看到该理论与案例研究,如情绪分类,欺诈检测,推荐系统,和图像识别,以便您得到最佳的理论和实践为工业中使用的绝大多数机器学习算法。在学习算法的同时,您还将接触到在所有主要云服务提供商上运行的机器学习模型。

你会学到什么?

  • 深入了解所有主要的机器学习和深度学习算法
  • 充分理解在构建模型时要避免的陷阱
  • 在云中实现机器学习算法
  • 通过对每种算法的案例研究,采用动手实践的方法
  • 学习集成学习的技巧,建立更精确的模型
  • 了解R/Python编程的基础知识和Keras深度学习框架

这本书是给谁看的

希望转换到数据科学角色的业务分析师/ IT专业人员。想要巩固机器学习知识的数据科学家。

成为VIP会员查看完整内容
0
131
小贴士
相关主题
相关VIP内容
专知会员服务
114+阅读 · 3月22日
专知会员服务
62+阅读 · 2月28日
专知会员服务
131+阅读 · 2月25日
专知会员服务
87+阅读 · 1月1日
专知会员服务
63+阅读 · 2020年11月27日
专知会员服务
49+阅读 · 2020年11月24日
专知会员服务
154+阅读 · 2020年6月3日
专知会员服务
123+阅读 · 2020年5月2日
专知会员服务
131+阅读 · 2020年2月11日
相关资讯
【干货书】计算机科学离散数学,627页pdf
专知
22+阅读 · 2020年8月31日
【新书册】贝叶斯神经网络,41页pdf
专知
10+阅读 · 2020年6月3日
421页《机器学习数学基础》最新2019版PDF下载
从入门到头秃,2018年机器学习图书TOP10
新智元
12+阅读 · 2018年12月8日
机器学习:从入门到晋级
云栖社区
3+阅读 · 2018年11月21日
入门 | 一文介绍机器学习中基本的数学符号
机器之心
21+阅读 · 2018年4月9日
【机器学习】从零开始入门机器学习算法实践
产业智能官
7+阅读 · 2017年12月1日
机器学习必备手册
机器学习研究会
12+阅读 · 2017年10月24日
如何用 3 个月零基础入门机器学习?
AI研习社
5+阅读 · 2017年9月27日
相关论文
Hui Zhang,Fanhai Zeng,Xiaoyun Jiang,George Em Karniadakis
0+阅读 · 4月7日
Xiaoyu Hu,Fang Yao
0+阅读 · 4月7日
Functorial Manifold Learning
Dan Shiebler
0+阅读 · 4月5日
Abigail Brauer,Megan Krawick,Manuel Santana
0+阅读 · 4月1日
FocalMix: Semi-Supervised Learning for 3D Medical Image Detection
Dong Wang,Yuan Zhang,Kexin Zhang,Liwei Wang
8+阅读 · 2020年3月20日
Bernhard Schölkopf
10+阅读 · 2019年11月24日
H. Ismail Fawaz,G. Forestier,J. Weber,L. Idoumghar,P. Muller
8+阅读 · 2019年3月14日
Ioannis Athanasiadis,Panagiotis Mousouliotis,Loukas Petrou
3+阅读 · 2018年11月12日
Shikun Liu,Edward Johns,Andrew J. Davison
16+阅读 · 2018年3月28日
Jiayuan Gu,Han Hu,Liwei Wang,Yichen Wei,Jifeng Dai
4+阅读 · 2018年3月19日
Top