在过去的十年里,人们对人工智能和机器学习的兴趣有了相当大的增长。从最广泛的意义上说,这些领域旨在“学习一些有用的东西”,了解生物体所处的环境。如何处理收集到的信息导致了算法的发展——如何处理高维数据和处理不确定性。在机器学习和相关领域的早期研究阶段,类似的技术在相对孤立的研究社区中被发现。虽然不是所有的技术都有概率论的自然描述,但许多都有,它是图模型的框架(图和概率论的结合),使从统计物理、统计、机器学习和信息理论的想法的理解和转移。在这种程度上,现在有理由期待机器学习研究人员熟悉统计建模技术的基础知识。这本书集中在信息处理和机器学习的概率方面。当然,没有人说这种方法是正确的,也没有人说这是唯一有用的方法。事实上,有人可能会反驳说,这是没有必要的,因为“生物有机体不使用概率论”。无论情况是否如此,不可否认的是,图模型和概率框架帮助机器学习领域出现了新算法和模型的爆炸式增长。我们还应该清楚,贝叶斯观点并不是描述机器学习和信息处理的唯一方法。贝叶斯和概率技术在需要考虑不确定性的领域中发挥了自己的作用。

http://www0.cs.ucl.ac.uk/staff/d.barber/brml/

本书结构

本书第一部分的目的之一是鼓励计算机科学专业的学生进入这一领域。许多现代学生面临的一个特别困难是有限的正规微积分和线性代数训练,这意味着连续和高维分布的细节可能会让他们离开。在以概率作为推理系统的一种形式开始时,我们希望向读者展示他们可能更熟悉的逻辑推理和动态规划的想法如何在概率环境中有自然的相似之处。特别是,计算机科学的学生熟悉的概念,算法为核心。然而,在机器学习中更常见的做法是将模型视为核心,而如何实现则是次要的。从这个角度来看,理解如何将一个数学模型转换成一段计算机代码是核心。

第二部分介绍了理解连续分布所需的统计背景,以及如何从概率框架来看待学习。第三部分讨论机器学习的主题。当然,当一些读者看到他们最喜欢的统计话题被列在机器学习下面时,他们会感到惊讶。统计学和机器学习之间的一个不同观点是,我们最终希望构建什么样的系统(能够完成“人类/生物信息处理任务的机器),而不是某些技术。因此,我认为这本书的这一部分对机器学习者来说是有用的。第四部分讨论了明确考虑时间的动态模型。特别是卡尔曼滤波器被视为图模型的一种形式,这有助于强调模型是什么,而不是像工程文献中更传统的那样把它作为一个“过滤器”。第五部分简要介绍了近似推理技术,包括随机(蒙特卡罗)和确定性(变分)技术。

成为VIP会员查看完整内容
0
50

相关内容

这本书通过探索计算机科学理论和机器学习双方可以相互传授的内容,将理论和机器学习联系起来。它强调了对灵活、易于操作的模型的需求,这些模型更好地捕捉使机器学习变得容易的东西,而不是让机器学习变得困难的东西。

理论计算机科学家将被介绍到机器学习的重要模型和该领域的主要问题。机器学习研究人员将以一种可访问的格式介绍前沿研究,并熟悉现代算法工具包,包括矩法、张量分解和凸规划松弛。

超越最坏情况分析的处理方法是建立对实践中使用的方法的严格理解,并促进发现令人兴奋的、解决长期存在的重要问题的新方法。

在这本书中,我们将涵盖以下主题:

(a)非负矩阵分解

(b)主题建模

(c)张量分解

(d)稀疏恢复

(e)稀疏编码

(f)学习混合模型

(g)矩阵补全

https://www.cambridge.org/core/books/algorithmic-aspects-of-machine-learning/165FD1899783C6D7162235AE405685DB

成为VIP会员查看完整内容
0
34

https://link.springer.com/book/10.1007/978-3-319-55444-0

这本引人入胜的和清晰的书面教科书/参考提供了一个必要的介绍,迅速兴起的跨学科领域的数据科学。它侧重于成为一名优秀的数据科学家的基本原则,以及建立收集、分析和解释数据的系统所需的关键技能。

《数据科学设计手册》是一个实用的见解来源,它突出了分析数据中真正重要的东西,并提供了对如何使用这些核心概念的直观理解。这本书没有强调任何特定的编程语言或数据分析工具套件,而是着重于重要设计原则的高层讨论。

《数据科学概论》是一门易于阅读的课程,理想情况下,它能满足本科生和早期研究生的需求。它揭示了这门学科如何处于统计学、计算机科学和机器学习的交叉点,具有自己独特的分量和特点。这些和相关领域的从业者会发现这本书非常适合自学。

成为VIP会员查看完整内容
0
43

机器学习是关于基于数据的学习、推理和行动。这是通过构建计算机程序来完成的,这些程序可以处理数据,提取有用的信息,对未知属性做出预测,并建议采取的行动或做出的决定。将数据分析变成机器学习的原因是,这个过程是自动化的,计算机程序是从数据中学习的。这意味着使用通用计算机程序,这些程序根据观察到的所谓训练数据自动调整程序的设置,以适应特定的应用程序环境。因此可以说,机器学习是一种通过实例编程的方式。机器学习的美妙之处在于,数据所代表的内容是非常随意的,我们可以设计出适用于不同领域的广泛实际应用的通用方法。我们通过下面的一系列例子来说明这一点。上述“通用计算机程序”是指数据的数学模型。也就是说,当我们开发和描述不同的机器学习方法时,我们使用的是数学语言。数学模型描述了与观测数据对应的相关数量或变量与感兴趣的属性(如预测、动作等)之间的关系。因此,模型是数据的紧凑表示,以精确的数学形式捕捉我们正在研究的现象的关键属性。使用哪个模型通常由机器学习工程师在查看可用数据时产生的见解和从业者对问题的总体理解来指导。在实践中实现该方法时,将该数学模型转换为可在计算机上执行的代码。然而,要理解计算机程序的实际作用,了解其基础数学也很重要。

这本书的目的是介绍监督机器学习,而不需要在该领域的任何经验。我们既关注基础的数学,也关注实践方面。本书是教科书,不是参考书,也不是编程手册。因此,它只包含一个仔细(但全面)的监督机器学习方法的选择,而没有编程代码。现在有许多精彩和证据确凿的代码包可用,我们深信,在很好地理解数学和内部运行的方法。在这本书中,我们从统计学的角度来讨论方法的统计特性。因此,它需要一些统计和概率论的知识,以及微积分和线性代数。我们希望,从头到尾阅读这本书将给读者一个良好的起点,作为一个机器学习工程师工作和/或继续在该学科的进一步研究。下图说明了章节之间的主要依赖关系。特别是在第二、三、四章中讨论了最基本的主题,我们建议读者先阅读这些章节,然后再阅读后面包含更高级的主题的章节(第5-9章)。第10章超越了机器学习的监督设置,第11章关注于设计一个成功的机器学习解决方案的一些更实际的方面,比前几章的技术性更少。最后,第十二章(由David Sumpter撰写)讨论了现代机器学习的某些伦理方面。

成为VIP会员查看完整内容
0
60

这本书的目的是介绍计算机科学家所需要的一些基本数学知识。读者并不期望自己是数学家,我们希望下面的内容对你有用。

成为VIP会员查看完整内容
0
79

机器学习中复杂的统计数据让许多开发人员感到担忧。了解统计学可以帮助你建立强大的机器学习模型,针对给定的问题陈述进行优化。这本书将教你所有需要执行复杂的统计计算所需的机器学习。您将获得有关监督学习、非监督学习、强化学习等统计信息。了解真实世界的例子,讨论机器学习的统计方面,并熟悉它。您还将设计用于执行诸如模型、参数拟合、回归、分类、密度收集等任务的程序。

到本书结束时,你将掌握机器学习所需的统计数据,并能够将你的新技能应用于任何类型的行业问题。

成为VIP会员查看完整内容
0
51

这本书是为任何想学习如何开发机器学习系统的人准备的。我们将从理论和实践两方面涵盖关于机器学习算法的最重要概念,并将使用Python编程语言中的Scikit-learn库实现许多机器学习算法。在第一章中,您将学习机器学习最重要的概念,在下一章中,您将主要学习分类。在最后一章中,你将学习如何训练你的模型。我假定你已经了解了编程的基础知识。

成为VIP会员查看完整内容
0
107

优化和机器学习的相互作用是现代计算科学最重要的发展之一。优化的公式和方法在设计从大量数据中提取基本知识的算法方面被证明是至关重要的。然而,机器学习并不仅仅是优化技术的消费者,而是一个快速发展的领域,它本身也在产生新的优化思想。这本书以一种对两个领域的研究人员都可访问的方式捕获了优化和机器学习之间交互的艺术的状态。

优化方法因其广泛的适用性和吸引人的理论特性而在机器学习中占有重要地位。当今机器学习模型的复杂性、规模和多样性日益增加,需要对现有假设进行重新评估。这本书开始了重新评估的过程。它描述了在诸如一阶方法,随机近似,凸松弛,内点方法,和近端方法等已建立的框架。它还专门关注一些新的主题,如正则化优化、鲁棒优化、梯度和次梯度方法、分裂技术和二阶方法。其中许多技术的灵感来自其他领域,包括运筹学、理论计算机科学和优化子领域。这本书将丰富机器学习社区和这些其他领域以及更广泛的优化社区之间正在进行的交叉发展。

成为VIP会员查看完整内容
0
81

概率论起源于17世纪的法国,当时两位伟大的法国数学家,布莱斯·帕斯卡和皮埃尔·德·费马,对两个来自机会博弈的问题进行了通信。帕斯卡和费马解决的问题继续影响着惠更斯、伯努利和DeMoivre等早期研究者建立数学概率论。今天,概率论是一个建立良好的数学分支,应用于从音乐到物理的学术活动的每一个领域,也应用于日常经验,从天气预报到预测新的医疗方法的风险。

本文是为数学、物理和社会科学、工程和计算机科学的二、三、四年级学生开设的概率论入门课程而设计的。它提出了一个彻底的处理概率的想法和技术为一个牢固的理解的主题必要。文本可以用于各种课程长度、水平和重点领域。

在标准的一学期课程中,离散概率和连续概率都包括在内,学生必须先修两个学期的微积分,包括多重积分的介绍。第11章包含了关于马尔可夫链的材料,为了涵盖这一章,一些矩阵理论的知识是必要的。

文本也可以用于离散概率课程。材料被组织在这样一种方式,离散和连续的概率讨论是在一个独立的,但平行的方式,呈现。这种组织驱散了对概率过于严格或正式的观点,并提供了一些强大的教学价值,因为离散的讨论有时可以激发更抽象的连续的概率讨论。在离散概率课程中,学生应该先修一学期的微积分。

为了充分利用文中的计算材料和例子,假设或必要的计算背景很少。所有在文本中使用的程序都是用TrueBASIC、Maple和Mathematica语言编写的。

成为VIP会员查看完整内容
0
68

管理统计和数据科学的原理包括:数据可视化;描述性措施;概率;概率分布;数学期望;置信区间;和假设检验。方差分析;简单线性回归;多元线性回归也包括在内。另外,本书还提供了列联表、卡方检验、非参数方法和时间序列方法。

教材:

  • 包括通常在入门统计学课程中涵盖的学术材料,但与数据科学扭曲,较少强调理论
  • 依靠Minitab来展示如何用计算机执行任务
  • 展示并促进来自开放门户的数据的使用
  • 重点是发展对程序如何工作的直觉
  • 让读者了解大数据的潜力和目前使用它的失败之处
成为VIP会员查看完整内容
1
109

介绍

这本书在保持非常务实的教导和结果导向付出很大的精力。构建聊天机器人不只是完成一个教程或遵循几个步骤,它本身就是一种技能。这本书肯定不会用大量的文本和过程让你感到无聊;相反,它采用的是边做边学的方法。到目前为止,在你的生活中,你肯定至少使用过一个聊天机器人。无论你是不是一个程序员,一旦你浏览这本书,你会发现构建模块的聊天机器人,所有的奥秘将被揭开。建立聊天机器人可能看起来很困难,但这本书将让你使它如此容易。我们的大脑不是用来直接处理复杂概念的;相反,我们一步一步地学习。当你读这本书的时候,从第一章到最后一章,你会发现事情的进展是多么的清晰。虽然你可以直接翻到任何一章,但我强烈建议你从第一章开始,因为它肯定会支持你的想法。这本书就像一个网络系列,你在读完一章之后就无法抗拒下一章的诱惑。在阅读完这本书后,你所接触到的任何聊天机器人都会在你的脑海中形成一幅关于聊天机器人内部是如何设计和构建的画面。

这本书适合谁?

这本书将作为学习与聊天机器人相关的概念和学习如何建立他们的一个完整的资源。那些将会发现这本书有用的包括: Python web开发人员希望扩大他们的知识或职业到聊天机器人开发。 学生和有抱负的程序员想获得一种新的技能通过亲身体验展示的东西,自然语言爱好者希望从头开始学习。 企业家如何构建一个聊天机器人的伟大的想法,但没有足够的技术关于如何制作聊天机器人的可行性信息。 产品/工程经理计划与聊天机器人相关项目。

如何使用这本书?

请记住,这本书的写作风格和其他书不一样。读这本书的时候要记住,一旦你完成了这本书,你就可以自己建造一个聊天机器人,或者教会别人如何建造一个聊天机器人。在像阅读其他书籍一样阅读这本书之前,务必记住以下几点:

  • 这本书涵盖了构建聊天机器人所需的几乎所有内容,而不是现有内容。
  • 这本书是关于花更多的时间在你的系统上做事情的,这本书就在你身边。确保您执行每个代码片段并尝试编写代码;不要复制粘贴。
  • 一定要按照书中的步骤去做;如果你不理解一些事情,不要担心。你将在本章的后面部分了解到。
  • 可以使用本书所提供的源代码及Jupyter NoteBook作为参考。

内容概要

  • Chapter 1: 在本章中,你将从商业和开发人员的角度了解与聊天机器人相关的事情。这一章为我们熟悉chatbots概念并将其转换为代码奠定了基础。希望在本章结束时,你会明白为什么你一定要为自己或你的公司创建一个聊天机器人。
  • Chapter 2: 在本章中会涉及聊天机器人的自然语言处理,你将学习到聊天机器人需要NLP时应该使用哪些工具和方法。这一章不仅教你在NLP的方法,而且还采取实际的例子和演示与编码的例子。本章还讨论了为什么使用特定的NLP方法可能需要在聊天机器人。注意,NLP本身就是一种技能。
  • Chapter 3: 在本章中,你将学习如何使用像Dialogflow这样的工具以一种友好而简单的方式构建聊天机器人。如果你不是程序员,你肯定会喜欢它,因为它几乎不需要编程技能。
  • Chapter 4:在本章中,你将学习如何以人们想要的方式构建聊天机器人。标题说的很艰难,但一旦你完成了前一章,你会想要更多,因为这一章将教如何建立内部聊天机器人从零开始,以及如何使用机器学习算法训练聊天机器人。
  • Chapter 5:在本章中,部署你的聊天机器人纯粹是设计给你的聊天机器人应用一个最后的推动。当你经历了创建聊天机器人的简单和艰难的过程后,你肯定不想把它留给自己。你将学习如何展示你的聊天机器人到世界使用Facebook和Slack,最后,整合他们在你自己的网站。
成为VIP会员查看完整内容
Building Chatbots with Python.pdf
0
120
小贴士
相关VIP内容
专知会员服务
34+阅读 · 10月18日
专知会员服务
43+阅读 · 9月16日
专知会员服务
79+阅读 · 7月27日
专知会员服务
51+阅读 · 7月19日
专知会员服务
81+阅读 · 2月26日
专知会员服务
68+阅读 · 2020年11月25日
专知会员服务
109+阅读 · 2020年7月29日
相关论文
Alexandre Défossez,Yossi Adi,Gabriel Synnaeve
0+阅读 · 10月19日
Sofia Ek,Dave Zachariah,Petre Stoica
0+阅读 · 10月19日
Medha Agarwal,Dootika Vats
0+阅读 · 10月18日
Tomaž Košir,Bor Plestenjak
0+阅读 · 10月17日
Jiefeng Li,Tong Chen,Ruiqi Shi,Yujing Lou,Yong-Lu Li,Cewu Lu
0+阅读 · 10月17日
Bayesian Attention Belief Networks
Shujian Zhang,Xinjie Fan,Bo Chen,Mingyuan Zhou
5+阅读 · 6月9日
Linfeng Liu,Michael C. Hughes,Soha Hassoun,Li-Ping Liu
6+阅读 · 6月4日
Antoine Liutkus,Ondřej Cífka,Shih-Lun Wu,Umut Şimşekli,Yi-Hsuan Yang,Gaël Richard
7+阅读 · 5月18日
The Knowledge Within: Methods for Data-Free Model Compression
Matan Haroush,Itay Hubara,Elad Hoffer,Daniel Soudry
3+阅读 · 2019年12月3日
Joseph Y. Halpern
5+阅读 · 2019年9月30日
Top