书籍简介

学习如何将基于大语言模型的应用安全高效地投入生产。 本实用书籍提供了清晰且富有示例的解释,涵盖了大语言模型(LLMs)如何工作、如何与它们互动,以及如何将LLM集成到自己的应用中。了解LLM与传统软件和机器学习的不同之处,探索如何将它们从实验室环境转化到实际应用中的最佳实践,并借助经验丰富的建议避开常见的陷阱。 在《大语言模型在生产中的应用》一书中,您将: • 掌握大语言模型及其背后的技术基础 • 评估何时使用现成的LLM,何时自己构建一个 • 高效地扩展机器学习平台,以满足LLM的需求 • 训练LLM基础模型并微调现有的LLM • 使用复杂架构(如PEFT和LoRA)将LLM部署到云端和边缘设备 • 构建应用程序,充分利用LLM的优势,同时减轻其弱点 《大语言模型在生产中的应用》为您提供了MLOps的宝贵见解,使您能够轻松无缝地将其引导至生产使用。在书中,您将获得关于从获取适用于LLM的训练数据集、构建平台到补偿LLM庞大规模的实践见解。此外,还包括提示工程、再训练和负载测试、成本管理和确保安全性的技巧与窍门。 前言:Joe Reis

购买印刷版书籍可获得Manning Publications提供的免费PDF和ePub格式电子书。


关于技术

大多数商业软件是通过迭代开发和改进的,甚至在部署后也可能发生重大变化。相比之下,由于LLM的创建成本高且修改困难,它们需要在前期进行细致的规划、严格的数据标准和精心执行的技术实施。将LLM集成到生产产品中将影响到您操作计划的方方面面,包括应用生命周期、数据管道、计算成本、安全性等。如果出错,可能会带来高昂的失败代价。


关于本书

《大语言模型在生产中的应用》将教您如何制定一个LLMOps计划,确保AI应用从设计到交付的顺利过渡。您将学习准备LLM数据集的技巧、像LORA和RLHF这样的成本高效训练方法,以及行业基准模型评估标准。在此过程中,您将通过三个令人兴奋的示例项目来运用新学到的技能:创建和训练一个定制的LLM、构建VSCode AI编码扩展以及将一个小型模型部署到树莓派。


本书内容:

• 成本与性能的平衡 • 再训练与负载测试 • 针对通用硬件优化模型 • 在Kubernetes集群上部署


读者对象

适合了解Python及云部署基础的 数据科学家和机器学习工程师。


作者介绍

Christopher Brousseau 和 Matt Sharp 是经验丰富的工程师,曾领导过多个成功的大规模LLM部署项目。


目录

  1. 语言的觉醒:为何大语言模型引起了关注

  2. 大语言模型:语言建模的深度解析

  3. 大语言模型操作:构建LLM平台

  4. 大语言模型的数据工程:为成功奠定基础

  5. 训练大语言模型:如何生成生成器

  6. 大语言模型服务:实用指南

  7. 提示工程:成为LLM的“低语者”

  8. 大语言模型应用:构建互动体验

  9. 创建LLM项目:重新实现Llama 3

  10. 创建编码助手项目:这会早些时候帮到你

  11. 在树莓派上部署LLM:可以做得更低吗?

  12. 生产:一个不断变化的领域:事情才刚刚开始

A. 语言学历史

B. 带有人类反馈的强化学习

C. 多模态潜在空间


作者简介

Christopher Brousseau 是JPMorganChase的Staff MLE,具有语言学和本地化背景,专注于语言学驱动的自然语言处理(NLP),尤其在国际化方面,并曾领导多个成功的机器学习和数据产品项目,涉及初创公司及财富500强企业。 Matt Sharp 是一名工程师,前数据科学家及资深的MLOps技术领导者,曾为初创公司和顶尖科技公司领导多个成功的数据项目,专注于在生产环境中部署、管理和扩展机器学习模型。

成为VIP会员查看完整内容
38

相关内容

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
【新书】使用生成式人工智能进行软件测试
专知会员服务
36+阅读 · 1月6日
【新书】大型语言模型实战:语言理解与生成
专知会员服务
63+阅读 · 2024年11月6日
【新书】实践大型语言模型:语言理解与生成
专知会员服务
60+阅读 · 2024年10月1日
【新书】生成式人工智能傻瓜书入门
专知会员服务
54+阅读 · 2024年9月24日
下载 | 512页教程《神经网络与深度学习》,2018最新著作
机器学习算法与Python学习
50+阅读 · 2019年1月6日
国家自然科学基金
14+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
33+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
164+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
425+阅读 · 2023年3月31日
Arxiv
71+阅读 · 2023年3月26日
Arxiv
154+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
14+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
33+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员