《分布式机器学习模式》是一本关于将机器学习从个人电脑扩展到大规模分布式集群的实用指南。分布式机器学习系统允许开发人员处理非常大的数据集,跨多个集群进行操作,利用自动化工具,以及获得硬件加速的好处。本书揭示了应对扩展机器学习系统的挑战的最佳实践技巧和内部窍门。 在《分布式机器学习模式》中,您将学到如何: * 应用分布式系统模式来构建可扩展和可靠的机器学习项目 * 构建具有数据摄取、分布式训练、模型服务等的ML流水线 * 使用Kubernetes、TensorFlow、Kubeflow和Argo Workflows自动化ML任务 * 在不同模式和方法之间进行权衡 * 管理和监控大规模机器学习工作负载
本书旨在将已建立的分布式系统模式应用于机器学习项目,同时探讨专门为机器学习创建的新的前沿模式。这本书坚实地扎根于现实世界,演示了如何使用基于TensorFlow、Kubernetes、Kubeflow和Argo Workflows的示例来应用这些模式。通过实际项目和清晰的DevOps技术,您可以轻松启动、管理和监控云原生的分布式机器学习流水线。 作者Yuan Tang是Argo和Kubeflow的项目负责人,也是TensorFlow和XGBoost的维护者,以及众多开源项目的作者。 本书适合熟悉机器学习基础、Bash、Python和Docker的数据分析师和工程师。 《分布式机器学习模式》包括以下内容: * 基本概念和背景 * 分布式机器学习系统的模式 * 构建分布式机器学习工作流程 * 项目概述和系统架构 * 相关技术概述 * 完整实现
这本书被评论为对处理分布式环境中的机器学习问题的深入指南,对分布式机器学习从业者来说是一本非常有价值的书籍。它提供了关于分布式训练思想、问题和解决方案的详细介绍,以及在TensorFlow、Kubernetes、Kubeflow和Argo Workflows基础上实现分布式模型训练和推理的全面项目。