【新书】检索增强生成（RAG）入门指南 - 专知VIP

会员服务 ·

0

检索增强生成 ·

【新书】检索增强生成（RAG）入门指南

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

《检索增强生成（RAG）入门指南》

——一本全面、通俗的人类友好型指南，带你掌握RAG的全部核心知识

图书简介

检索增强生成（Retrieval Augmented Generation，简称 RAG）通过引入外部知识库，为大语言模型（LLM）提供额外上下文信息，使其能够准确回答涉及私有内容、最新信息甚至实时对话的问题。RAG 强大而灵活，而在《检索增强生成入门指南》中，你将发现它同样易于理解与实践！本书将带你学习以下内容： * RAG 系统的组成部分 * 如何构建 RAG 知识库 * 索引与生成流程（pipeline） * 如何评估 RAG 系统 * 高级 RAG 策略 * 实用的 RAG 工具、技术与框架

《检索增强生成入门指南》为AI初学者提供了一套简洁但全面的RAG入门路径。从最基本的索引与生成流程出发，你将逐步了解模块化RAG系统，以及如何处理图像、电子表格等多模态数据。

技术背景

如果你希望使用大语言模型回答与自身业务相关的问题，很可能会失望：LLM 对你的具体业务毫无了解，甚至可能胡编乱造。**检索增强生成（RAG）**正是为解决这类问题而生的方法。它首先从你的知识存储中（如搜索索引、向量数据库或文档集）检索出最相关的信息，然后结合用户的提示词与检索内容生成答案。这种方式有效避免“幻觉”问题，并让你可控生成内容。

关于本书

《检索增强生成入门指南》以通俗易懂的语言介绍 RAG，内容结构清晰，配有大量实用的 Python 代码示例。书中按概念递进，从RAG的基础知识到高级用法均有覆盖，并展示如何使用如 LangChain 等工具与 Python 库来实现RAG系统。即使你是 AI 新手，也能在实践中构建完整的 RAG 应用系统。

核心内容包括

RAG 的核心组件与实际应用 * RAG 系统的评估方法：准确性、相关性与忠实性 * 主流 RAG 实现工具与开发框架

适读人群

本书适合数据科学家、工程师和技术管理者阅读，无需具备大语言模型相关经验。示例代码简洁且注释详尽，便于理解和动手实践。

作者简介

Abhinav Kimothi 是资深的数据与AI专家，曾在数据科学、机器学习与人工智能领域担任多个咨询与领导职位，拥有超过15年从业经验，现任 Yarnit 公司人工智能副总裁。

目录结构

**第1部分

LLM 与 RAG 的必要性 1. RAG 系统结构与设计

**第2部分

索引流程：为RAG构建知识库 1. 生成流程：生成具上下文的LLM响应 1. RAG系统评估：准确性、相关性与忠实性

**第3部分

RAG系统的演进：基础、进阶与模块化RAG 1. RAGOps 技术栈的演进

**第4部分

图结构、多模态、智能体化与其他RAG变体 1. RAG开发框架与未来探索

成为VIP会员查看完整内容

0

相关内容

【新书】大语言模型如何工作？200页pdf

【新书】大语言模型如何工作？200页pdf

专知会员服务

41+阅读 · 6月20日

【新书】使用生成式人工智能进行软件测试

【新书】使用生成式人工智能进行软件测试

专知会员服务

40+阅读 · 1月6日

【新书】基于RAG的生成式AI：使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道

【新书】基于RAG的生成式AI：使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道

专知会员服务

54+阅读 · 2024年12月15日

【新书】生成式人工智能傻瓜书入门

【新书】生成式人工智能傻瓜书入门

专知会员服务

54+阅读 · 2024年9月24日

【新书】面向对象软件设计 (C++)

【新书】面向对象软件设计 (C++)

专知会员服务

35+阅读 · 2024年7月24日

【2023新书】ChatGPT入门：解锁会话式人工智能的力量和潜力的全面指南

【2023新书】ChatGPT入门：解锁会话式人工智能的力量和潜力的全面指南

专知会员服务

70+阅读 · 2023年12月6日

从数学推导开始，7万字一定带你学会支持向量机（附118PDF下载）

从数学推导开始，7万字一定带你学会支持向量机（附118PDF下载）

专知会员服务

56+阅读 · 2022年7月20日

【干货书】统计学习导论，431页pdf讲解数据科学知识

【干货书】统计学习导论，431页pdf讲解数据科学知识

专知会员服务

80+阅读 · 2021年6月7日

【2020程序猿必看新书】现代C语言程序设计，Modern C，408页pdf，新视角指南好书

【2020程序猿必看新书】现代C语言程序设计，Modern C，408页pdf，新视角指南好书

专知会员服务

113+阅读 · 2020年2月6日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【干货书】Python中的数据结构和算法，928页pdf

【干货书】Python中的数据结构和算法，928页pdf

专知

20+阅读 · 2022年9月25日

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

专知

51+阅读 · 2020年12月4日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

38+阅读 · 2020年5月9日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知

15+阅读 · 2020年3月25日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知

69+阅读 · 2020年1月30日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

下载 | 512页教程《神经网络与深度学习》，2018最新著作

下载 | 512页教程《神经网络与深度学习》，2018最新著作

机器学习算法与Python学习

50+阅读 · 2019年1月6日

下载 | 954页《数据可视化》手册

下载 | 954页《数据可视化》手册

机器学习算法与Python学习

22+阅读 · 2019年1月3日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

【Keras作者Chollet最新力作】深度学习Python教程实战书籍

【Keras作者Chollet最新力作】深度学习Python教程实战书籍

专知

16+阅读 · 2017年12月1日

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

6+阅读 · 2017年6月30日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

4+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

468+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

145+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

170+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

ResMLP: Feedforward networks for image classification with data-efficient training

Arxiv

12+阅读 · 2021年5月7日

VIP会员

相关主题

检索增强生成

相关VIP内容

【新书】大语言模型如何工作？200页pdf

【新书】大语言模型如何工作？200页pdf

专知会员服务

41+阅读 · 6月20日

【新书】使用生成式人工智能进行软件测试

【新书】使用生成式人工智能进行软件测试

专知会员服务

40+阅读 · 1月6日

【新书】基于RAG的生成式AI：使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道

【新书】基于RAG的生成式AI：使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道

专知会员服务

54+阅读 · 2024年12月15日

【新书】生成式人工智能傻瓜书入门

【新书】生成式人工智能傻瓜书入门

专知会员服务

54+阅读 · 2024年9月24日

【新书】面向对象软件设计 (C++)

【新书】面向对象软件设计 (C++)

专知会员服务

35+阅读 · 2024年7月24日

【2023新书】ChatGPT入门：解锁会话式人工智能的力量和潜力的全面指南

【2023新书】ChatGPT入门：解锁会话式人工智能的力量和潜力的全面指南

专知会员服务

70+阅读 · 2023年12月6日

从数学推导开始，7万字一定带你学会支持向量机（附118PDF下载）

从数学推导开始，7万字一定带你学会支持向量机（附118PDF下载）

专知会员服务

56+阅读 · 2022年7月20日

【干货书】统计学习导论，431页pdf讲解数据科学知识

【干货书】统计学习导论，431页pdf讲解数据科学知识

专知会员服务

80+阅读 · 2021年6月7日

【2020程序猿必看新书】现代C语言程序设计，Modern C，408页pdf，新视角指南好书

【2020程序猿必看新书】现代C语言程序设计，Modern C，408页pdf，新视角指南好书

专知会员服务

113+阅读 · 2020年2月6日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型驱动的AI智能体通信综述：协议、安全风险与防御对策

基于BERT和知识图谱的武器装备问答系统

中文版4000字 | 战场人工智能革命尚未到来：当前俄乌AI无人机发展现状

中文版 | 转向防务：硅谷如何谋划接管战争产业

相关资讯

【干货书】Python中的数据结构和算法，928页pdf

【干货书】Python中的数据结构和算法，928页pdf

专知

20+阅读 · 2022年9月25日

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

【2020新书】程序员数学基础, 692页pdf，用Python实现3D图形、机器学习和仿真

专知

51+阅读 · 2020年12月4日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

38+阅读 · 2020年5月9日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知

15+阅读 · 2020年3月25日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知

69+阅读 · 2020年1月30日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

下载 | 512页教程《神经网络与深度学习》，2018最新著作

下载 | 512页教程《神经网络与深度学习》，2018最新著作

机器学习算法与Python学习

50+阅读 · 2019年1月6日

下载 | 954页《数据可视化》手册

下载 | 954页《数据可视化》手册

机器学习算法与Python学习

22+阅读 · 2019年1月3日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

【Keras作者Chollet最新力作】深度学习Python教程实战书籍

【Keras作者Chollet最新力作】深度学习Python教程实战书籍

专知

16+阅读 · 2017年12月1日

相关基金

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

6+阅读 · 2017年6月30日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

4+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

468+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

145+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

170+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

ResMLP: Feedforward networks for image classification with data-efficient training

Arxiv

12+阅读 · 2021年5月7日

微信扫码咨询专知VIP会员