简介: 自然语言处理(NLP) 系统的开发已建立了通过人脑与人脑之间进行信息流和计算的渐增技术。现在,我们只能在搜索栏中键入几个字符,就可以检索到我们需要完成的确切信息。本书为我们提供了从基础知识到动手构建后端NLP系统的全套学习内容,希望对您开启NLP学习之旅有所帮助。
自然语言处理是现实世界中处理和生成自然语言文本的使用指南。在本书中,作者为我们提供了构建后端NLP系统所要的所有工具和技术,可以支持聊天机器人、垃圾邮件过滤器、论坛主持人、情感分析器、知识库生成器等您可以想象的自然语言文本挖掘程序或其他NLP应用程序。本书提供了许多最佳实践实例并深入了解了最新的NLP算法的功能。对于特殊主题,作者也提供了足够的背景材料和引用资源。
作者介绍: Hobson Lane在构建自主系统以代表人类做出重要决策方面拥有20年的经验。 在Talentpair,HOBSON 通过机器来阅读和理解简历,并且出现的错误比大多数招聘者的要少。 在Aira,他帮助建立了他们的第一个聊天机器人,为盲人解释视觉世界。 他为开源项目(例如Keras,scikit-learn,PyBrain,PUGNLP和ChatterBot)做出了巨大贡献。 他目前正在为Total Good开展一个开放式科学研究和教育项目,包括建立一个开源认知助手。 他在AIAA,PyCon,PAIS和IEEE上发表多篇论文,并获得了机器人技术和自动化方面的多项专利。
Hannes Max Hapke是一名电气工程师,是一名机器学习工程师。 高中时他疯狂迷上了神经网络,同时研究了在微控制器上计算神经网络的方法。 在大学后期,他运用神经网络的概念来有效地控制可再生能源发电厂。 Hannes喜欢使软件开发和机器学习。 他与人合著了深度学习模型和用于招聘,能源和医疗保健应用的机器学习pipeline。
Cole Howard是一位机器学习工程师,NLP从业者和作家。 他为超维机器智能系统(深度学习神经网络)开发了大型电子商务推荐引擎和最新的神经网络,在Kaggle竞赛的排行榜中名列前茅。 他在 Open Source Bridge Conference和Hack大学上发表了关于卷积神经网络,递归神经网络及其在自然语言处理中的作用的演讲。
内容介绍:
本书的第一部分介绍了自然语言以及将自然语言转换为可以搜索和计算的数字的基础方法,如果您不熟悉Python和NLP,可以从书的第一部分开始。掌握了基础知识之后,一些简单的循环计算可以解决一些重要的问题,比如垃圾邮件过滤。
本书的第二部分的核心是对神经网络复杂计算和通信网络的探索,例如文本摘要以及语言翻译,将会对词向量、文档句子有了新的认识,并且该部分作者提供了相关代码,通过实际的操作会对该部分内容有一个更深入的了解与认识。
本书的第三部分,将跟着作者学习如何构建与人进行问答对话的机器。将学习如何提取日期和名称等信息来构建应用程序,在最后三章,将介NLP的棘手问题,将学习到构建聊天机器人的几种不同方法,以及处理大型语料库的算法。