书籍简介
学习如何将基于大语言模型的应用安全高效地投入生产。 本实用书籍提供了清晰且富有示例的解释,涵盖了大语言模型(LLMs)如何工作、如何与它们互动,以及如何将LLM集成到自己的应用中。了解LLM与传统软件和机器学习的不同之处,探索如何将它们从实验室环境转化到实际应用中的最佳实践,并借助经验丰富的建议避开常见的陷阱。 在《大语言模型在生产中的应用》一书中,您将: • 掌握大语言模型及其背后的技术基础 • 评估何时使用现成的LLM,何时自己构建一个 • 高效地扩展机器学习平台,以满足LLM的需求 • 训练LLM基础模型并微调现有的LLM • 使用复杂架构(如PEFT和LoRA)将LLM部署到云端和边缘设备 • 构建应用程序,充分利用LLM的优势,同时减轻其弱点 《大语言模型在生产中的应用》为您提供了MLOps的宝贵见解,使您能够轻松无缝地将其引导至生产使用。在书中,您将获得关于从获取适用于LLM的训练数据集、构建平台到补偿LLM庞大规模的实践见解。此外,还包括提示工程、再训练和负载测试、成本管理和确保安全性的技巧与窍门。 前言:Joe Reis
购买印刷版书籍可获得Manning Publications提供的免费PDF和ePub格式电子书。
关于技术
大多数商业软件是通过迭代开发和改进的,甚至在部署后也可能发生重大变化。相比之下,由于LLM的创建成本高且修改困难,它们需要在前期进行细致的规划、严格的数据标准和精心执行的技术实施。将LLM集成到生产产品中将影响到您操作计划的方方面面,包括应用生命周期、数据管道、计算成本、安全性等。如果出错,可能会带来高昂的失败代价。
关于本书
《大语言模型在生产中的应用》将教您如何制定一个LLMOps计划,确保AI应用从设计到交付的顺利过渡。您将学习准备LLM数据集的技巧、像LORA和RLHF这样的成本高效训练方法,以及行业基准模型评估标准。在此过程中,您将通过三个令人兴奋的示例项目来运用新学到的技能:创建和训练一个定制的LLM、构建VSCode AI编码扩展以及将一个小型模型部署到树莓派。
本书内容:
• 成本与性能的平衡 • 再训练与负载测试 • 针对通用硬件优化模型 • 在Kubernetes集群上部署
读者对象
适合了解Python及云部署基础的 数据科学家和机器学习工程师。
作者介绍
Christopher Brousseau 和 Matt Sharp 是经验丰富的工程师,曾领导过多个成功的大规模LLM部署项目。
目录
语言的觉醒:为何大语言模型引起了关注
大语言模型:语言建模的深度解析
大语言模型操作:构建LLM平台
大语言模型的数据工程:为成功奠定基础
训练大语言模型:如何生成生成器
大语言模型服务:实用指南
提示工程:成为LLM的“低语者”
大语言模型应用:构建互动体验
创建LLM项目:重新实现Llama 3
创建编码助手项目:这会早些时候帮到你
在树莓派上部署LLM:可以做得更低吗?
生产:一个不断变化的领域:事情才刚刚开始
A. 语言学历史
B. 带有人类反馈的强化学习
C. 多模态潜在空间
作者简介
Christopher Brousseau 是JPMorganChase的Staff MLE,具有语言学和本地化背景,专注于语言学驱动的自然语言处理(NLP),尤其在国际化方面,并曾领导多个成功的机器学习和数据产品项目,涉及初创公司及财富500强企业。 Matt Sharp 是一名工程师,前数据科学家及资深的MLOps技术领导者,曾为初创公司和顶尖科技公司领导多个成功的数据项目,专注于在生产环境中部署、管理和扩展机器学习模型。