【导读】机器学习系统:这个规模的设计是一个示例丰富的指南,教你如何在你的机器学习系统中实现反应式设计解决方案,使它们像一个构建良好的web应用一样可靠。
本文首先介绍了反应性机器学习基础,然后介绍如何建立一个反应式机器学习系统(收集数据、生成特征、学习模型、评估模型、发布模型),最后介绍如何操作一个机器学习系统。
1. 作者介绍
Jeff Smith使用Scala和Spark构建大规模的机器学习系统。在过去的十年中,他一直在纽约,旧金山和香港的多家初创公司从事数据科学应用的研究。他在博客中谈到了构建现实世界机器学习系统的各个方面。
2. 内容大纲
Part 1. 反应性机器学习基础
第一章. 反应性机器学习
第二章. 使用反应性工具
Part 2. 建立一个反应式机器学习系统(Building a reactive machine learning system)
第三章. 收集数据(Collecting data)
第四章. 生成特征(Generating features)
第五章. 学习模型(Learning models)
第六章. 评估模型( Evaluating models)
第七章. 发布模型(Publishing models)
第八章. 作答(Responding)
Part 3. 操作一个机器学习系统(Operating a machine learning system)
第三章. 陈述(Delivering)
第四章. 发展智力(Evolving intelligence)
4. 内容简介
Part 1.
响应式机器学习汇集了几个不同的技术领域,而本书的这一部分旨在确保您对所有这些领域都有足够的了解。从第一章开始,您将在整本书中研究和构建机器学习系统。如果您没有机器学习的经验,那么一定要熟悉它的工作原理。您还将了解现实世界中通常如何构建机器学习系统的所有问题。掌握了这些知识之后,您就可以准备应对另一个重要的话题:反应式系统设计。将反应性系统设计技术应用于构建机器学习系统的挑战是本书的核心主题。
本书概述了您将要做的事情之后,第二章重点介绍了如何做。本章介绍了整本书中将使用的三种技术:Scala编程语言,Akka工具包和Spark数据处理库。这些功能强大的技术只能在一章中开始学习。本书的其余部分将更深入地介绍如何使用它们来解决实际问题。
Part 2.
这是本书的核心。这部分将建立您对机器学习系统组件的知识,从原始数据开始,一直循环到真实世界。
第三章是关于收集数据的。对于机器学习书来说,这不是正常的一章:我们不会浪费时间去浪费数据的来源,而是会认真研究一系列数据问题,重点关注数据何时是大数据,快速数据和多毛数据。
第4章探讨了推导有用的数据表示形式,即功能。这是机器学习系统开发人员可以拥有的最重要技能之一,并且通常是工作的最大部分。
进入第5章后,您就应该准备做每个人在机器学习中都专注的事情:学习一些模型。整本书中都有关于学习模型的书籍,但是本章仅代表一种观点,将使您了解此步骤如何与之前和之后的内容联系起来。我将向您介绍一些有用的技术,这些技术可在您的系统各部分不如您所希望的那样容易连接时使用。
第6章涵盖了有关如何对所生成的机器学习模型进行决策的丰富主题。并非所有模型都是一样的。学习模型时可能会遇到一系列常见错误,因此,我将尝试为您提供一些工具,用它们来找出好模型和坏模型之间的区别。
第7章讨论将您制作的模型带到有用的地方。坐在笔记本电脑上的模型对任何人来说都没什么用,他们必须可供客户,同事等使用。本章介绍如何构建可以使用模型的服务。
最后,在第8章中,您将使用模型来影响现实世界。这是橡皮筋上路的地方:您已经完成了响应,并满足了用户的请求,从而结束了循环。响应式系统设计就是关于您如何满足用户期望的。因此,在第8章中,我们将我们的观点牢固地转向了您的机器学习系统的用户,并了解了如何实现这些期望。
Part 3.
本书的一部分着重于拥有一个完整的机器学习系统,而第3部分则是接下来的内容。在运行机器学习系统的整个生命周期中,必须完成各种工作,以便您可以更改和改进系统。
第9章更深入地介绍了如何构建和部署机器学习系统。它涵盖了为其他类型的软件应用程序的操作而开发的最佳实践,并将它们应用于反应式机器学习系统的独特职责。
第10章介绍了如何逐步提高系统的智能功能。它介绍了人工智能平台的远大抱负。最后一章提供了本书关于如何设计系统的最广泛的见解。我鼓励您采用这种广泛的观点,来思考您作为反应式机器学习系统的架构师所开发的技能。
书籍地址:
便捷查看下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“MLS2020” 就可以获取《【Manning干货书】机器学习系统可扩展规模设计(MLS),224页PDF》专知下载链接索引