近年来,AI在语言能力方面取得了惊人的进展。在深度学习快速发展的推动下,语言AI系统的文本生成与理解能力达到了前所未有的高度。这一趋势催生了新的功能、产品,甚至整个行业的兴起。通过本书,Python开发者将学习到如何利用这些强大功能的实用工具和概念。 您将学习如何利用预训练大型语言模型的强大功能,应用于诸如文案撰写和摘要生成等场景;创建超越关键词匹配的语义搜索系统;构建能够分类和聚类文本的系统,以实现对大量文档的可扩展理解;并使用现有的库和预训练模型进行文本分类、搜索和聚类。 本书还将向您展示如何: * 构建高级LLM(大型语言模型)管道,以聚类文本文档并探索其所属主题 * 构建语义搜索引擎,通过密集检索(dense retrieval)和重排序(reranking)等方法超越关键词搜索 * 探索这些模型在多种应用场景中的实际价值 * 理解如BERT和GPT等Transformer模型的底层架构 * 深入了解大型语言模型(LLM)是如何训练的 * 理解不同的微调方法如何针对特定应用优化LLM(生成模型微调、对比微调、上下文学习等)