《LLMOps:大语言模型的生产环境管理》

书籍简介(中文翻译)

关于大语言模型,有一件事必须明确:它们已经不再遵循传统规则。面对生成式人工智能(GenAI),传统的 MLOps 系统彻底崩溃——模型会幻觉,原有的安全假设不再成立,监控机制失灵,智能体系统无法运行……你会突然发现自己身处未知领域。而这正是 LLMOps(大语言模型运维)作为一门全新学科诞生的原因。 《LLMOps:大语言模型的生产环境管理》 是一本实战指南,帮助你应对现实世界中真正的用户和商业场景下的 LLM 系统运行问题。本书并不聚焦于构建炫酷的演示程序,而是聚焦于如何让大语言模型系统在真实环境中稳定运行。 你将学习如何: * 应对 LLM 运维所需的新角色与新流程 * 在传统指标不再适用的情况下,构建有效的性能监控机制 * 建立真正适用于 GenAI 的评估体系、治理结构与安全审计流程 * 管理复杂的智能体系统、RAG 系统以及不断演化的提示词(prompts) * 扩展系统基础设施,同时控制计算资源成本


作者简介(中文翻译)

Abi Aryan 是 Abide AI(www.abideai.com)的创始人,也是一位具有近十年工业经验的机器学习研究工程师,专注于构建生产级机器学习系统。她拥有数学背景,曾在加州大学洛杉矶分校(UCLA)认知系统实验室担任访问研究学者,师从著名因果推理专家 Judea Pearl 博士,研究方向为智能体系统开发。 Abi 在 AutoML、多智能体系统与大语言模型领域发表多篇研究论文,并长期担任 NeurIPS、ACL、EMNLP、AABI 等顶级会议的审稿人。她当前的研究方向包括:AI 智能体的反思性智能(reflective intelligence)多智能体系统的分布式自愈协议,以及大规模 AI 系统的 GPU 工程优化

成为VIP会员查看完整内容
10

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。
【斯坦福博士论文】在复杂环境中决策学习内容
专知会员服务
32+阅读 · 4月14日
利用多个大型语言模型:关于LLM集成的调研
专知会员服务
34+阅读 · 2月27日
模仿、探索与自我提升:慢思考推理系统的复现之路
专知会员服务
29+阅读 · 2024年12月14日
大型模型中的参数高效微调:方法论综述
专知会员服务
64+阅读 · 2024年11月3日
KG-Agent:面向KG复杂推理的高效自治代理框架
专知会员服务
33+阅读 · 2024年6月1日
AI何以涌现:复杂适应系统视角的ChatGPT和大语言模型
专知会员服务
59+阅读 · 2024年2月10日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
基于模型的强化学习综述
专知会员服务
147+阅读 · 2022年7月13日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
Auto-Keras与AutoML:入门指南
云栖社区
18+阅读 · 2019年2月9日
深度学习的GPU:深度学习中使用GPU的经验和建议
数据挖掘入门与实战
11+阅读 · 2018年1月3日
鲍捷 | 知识表示——面向实战的介绍
开放知识图谱
11+阅读 · 2017年10月23日
VAE、GAN、Info-GAN:全解深度学习三大生成模型
数据派THU
20+阅读 · 2017年9月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
44+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
78+阅读 · 2023年3月26日
Arxiv
172+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【斯坦福博士论文】在复杂环境中决策学习内容
专知会员服务
32+阅读 · 4月14日
利用多个大型语言模型:关于LLM集成的调研
专知会员服务
34+阅读 · 2月27日
模仿、探索与自我提升:慢思考推理系统的复现之路
专知会员服务
29+阅读 · 2024年12月14日
大型模型中的参数高效微调:方法论综述
专知会员服务
64+阅读 · 2024年11月3日
KG-Agent:面向KG复杂推理的高效自治代理框架
专知会员服务
33+阅读 · 2024年6月1日
AI何以涌现:复杂适应系统视角的ChatGPT和大语言模型
专知会员服务
59+阅读 · 2024年2月10日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
基于模型的强化学习综述
专知会员服务
147+阅读 · 2022年7月13日
相关资讯
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
Auto-Keras与AutoML:入门指南
云栖社区
18+阅读 · 2019年2月9日
深度学习的GPU:深度学习中使用GPU的经验和建议
数据挖掘入门与实战
11+阅读 · 2018年1月3日
鲍捷 | 知识表示——面向实战的介绍
开放知识图谱
11+阅读 · 2017年10月23日
VAE、GAN、Info-GAN:全解深度学习三大生成模型
数据派THU
20+阅读 · 2017年9月23日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
44+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员