自然语言处理实战教你如何创建实用的NLP应用,而不陷入复杂的语言理论和深度学习的数学。在这本引人入胜的书中,您将探索构建大量强大的NLP应用所需的核心工具和技术,包括聊天机器人、语言检测器和文本分类器。
真实世界的自然语言处理不是典型的自然语言处理教科书。我们专注于构建真实世界的NLP应用。这里真实世界的意义有两个方面:首先,我们关注构建真实世界的NLP应用需要什么。作为读者,您不仅将学习如何训练NLP模型,还将学习如何设计、开发、部署和监控它们。在此过程中,您还将学习现代NLP模型的基本构建模块,以及对构建NLP应用有用的NLP领域的最新开发。其次,与大多数介绍性书籍不同,我们采用自上而下的教学方法。我们不采用自下而上的方法,一页页地展示神经网络理论和数学公式,而是专注于快速构建“正常工作”的NLP应用程序。然后我们深入研究组成NLP应用的各个概念和模型。您还将学习如何使用这些基本构建块构建端到端定制NLP应用,以满足您的需求。
这本书由三个部分组成,共11章。第1部分介绍了NLP的基础知识,其中我们学习了如何使用AllenNLP 快速构建一个NLP应用,以完成情感分析和序列标记等基本任务。
第1章首先介绍了NLP的“什么”和“为什么”——什么是NLP,什么不是NLP,如何使用NLP技术,以及NLP如何与人工智能的其他领域相关联。
第2章演示了如何构建第一个NLP应用程序,一个情感分析器,并介绍了现代NLP模型的基础知识——单词嵌入和递归神经网络(RNN)。
第3章介绍了自然语言处理应用的两个重要组成部分,单词和句子的嵌入,并演示了如何使用和训练它们。
第4章讨论了最简单但最重要的NLP任务之一,句子分类,以及如何在这个任务中使用RNN。
第5章介绍了序列标注任务,如词性标注和命名实体提取。它还涉及到一个相关的技术,语言建模。
第2部分介绍高级NLP主题,包括序列到序列模型、Transformer以及如何利用迁移学习和预先训练过的语言模型来构建强大的NLP应用。
第6章介绍了序列到序列的模型,它将一个序列转换为另一个序列。我们在一个小时内构建了一个简单的机器翻译系统和一个聊天机器人。
第7章讨论了另一种流行的神经网络结构,卷积神经网络(CNN)。
第8章深入介绍了Transformer,它是当今最重要NLP模型之一。我们将演示如何使用Transformer构建改进的机器翻译系统和拼写检查器。
第9章在前一章的基础上,讨论了迁移学习,这是现代NLP中的一种流行的技术,使用预先训练过的语言模型,如BERT。
第3部分将讨论与开发NLP应用程序相关的主题,这些应用程序对真实数据具有健壮性,并部署和服务它们。
第10章详细介绍了开发NLP应用程序时的最佳实践,包括批处理和填充、正则化和超参数优化。
第11章总结了如何部署和服务NLP模型。它还涵盖了如何解释和解释ML模型。