图书简介
检索增强生成(Retrieval Augmented Generation,简称 RAG)通过引入外部知识库,为大语言模型(LLM)提供额外上下文信息,使其能够准确回答涉及私有内容、最新信息甚至实时对话的问题。RAG 强大而灵活,而在《检索增强生成入门指南》中,你将发现它同样易于理解与实践! 本书将带你学习以下内容: * RAG 系统的组成部分 * 如何构建 RAG 知识库 * 索引与生成流程(pipeline) * 如何评估 RAG 系统 * 高级 RAG 策略 * 实用的 RAG 工具、技术与框架
《检索增强生成入门指南》为AI初学者提供了一套简洁但全面的RAG入门路径。从最基本的索引与生成流程出发,你将逐步了解模块化RAG系统,以及如何处理图像、电子表格等多模态数据。
如果你希望使用大语言模型回答与自身业务相关的问题,很可能会失望:LLM 对你的具体业务毫无了解,甚至可能胡编乱造。**检索增强生成(RAG)**正是为解决这类问题而生的方法。它首先从你的知识存储中(如搜索索引、向量数据库或文档集)检索出最相关的信息,然后结合用户的提示词与检索内容生成答案。这种方式有效避免“幻觉”问题,并让你可控生成内容。
《检索增强生成入门指南》以通俗易懂的语言介绍 RAG,内容结构清晰,配有大量实用的 Python 代码示例。书中按概念递进,从RAG的基础知识到高级用法均有覆盖,并展示如何使用如 LangChain 等工具与 Python 库来实现RAG系统。即使你是 AI 新手,也能在实践中构建完整的 RAG 应用系统。
RAG 的核心组件与实际应用 * RAG 系统的评估方法:准确性、相关性与忠实性 * 主流 RAG 实现工具与开发框架
本书适合数据科学家、工程师和技术管理者阅读,无需具备大语言模型相关经验。示例代码简洁且注释详尽,便于理解和动手实践。
Abhinav Kimothi 是资深的数据与AI专家,曾在数据科学、机器学习与人工智能领域担任多个咨询与领导职位,拥有超过15年从业经验,现任 Yarnit 公司人工智能副总裁。
LLM 与 RAG 的必要性 1. RAG 系统结构与设计
索引流程:为RAG构建知识库 1. 生成流程:生成具上下文的LLM响应 1. RAG系统评估:准确性、相关性与忠实性
RAG系统的演进:基础、进阶与模块化RAG 1. RAGOps 技术栈的演进
图结构、多模态、智能体化与其他RAG变体 1. RAG开发框架与未来探索