AI 在过去的几年中获得了惊人的新语言能力。在深度学习的快速进步推动下,语言 AI 系统现在能够比以往任何时候都更好地编写和理解文本。这一趋势促成了新功能、产品和整个行业的崛起。有了这本书,Python 开发者将学到他们今天需要使用这些能力的实用工具和概念。 您将学习如何利用预训练的大型语言模型的能力,用于如拷贝写作和摘要等用例;创建超越关键词匹配的语义搜索系统;构建系统对文本进行分类和聚类,从而使大量的文本文件可扩展理解;以及使用现有库和预训练模型进行文本分类、搜索和聚类 。 本书还将教您如何: 构建高级的 LLM(大型语言模型)流水线来聚类文本文档并探索它们所属的主题 构建超越关键词搜索的语义搜索引擎,使用像密集检索和重新排名这样的方法 了解这些模型可以提供价值的各种用例 理解像 BERT 和 GPT 这样的基础 Transformer 模型的架构 深入了解 LLMs 如何被训练 理解为特定应用优化 LLMs 的不同方法(生成模型微调、对比微调、上下文学习等) 使用像生成模型微调、对比微调和上下文学习这样的方法为特定应用优化 LLMs。