【Manning新书】自然语言处理入门,458页pdf

2022 年 9 月 22 日 专知


我写这本书的主要目的是帮助你了解NLP领域是多么令人兴奋,在这个领域工作的可能性是多么无限,以及现在的门槛是多么低。我的目标是帮助你轻松开始在这个领域,并向你展示你可以在几天内实现多么广泛的不同的应用,即使你以前从未在这个领域工作过。这本书可以通过一系列的实际应用作为一个全面的指南,如果你只对一些实际任务感兴趣,也可以作为参考书。到你读完这本书的时候,你就已经学会了

https://www.manning.com/books/getting-started-with-natural-language-processing#:~:text=about%20the%20book,user%20profiling%2C%20and%20much%20more.

  • 了解基本的NLP任务,并能够在实际场景中识别遇到的任何特定任务。我们将涵盖诸如情感分析、文本分类、信息搜索等流行任务。

  • 一整套的NLP算法和技术,包括词干提取、词形还原、词性标注等。您将学习如何将一系列实用方法应用于文本,例如向量化、特征提取、有监督和无监督机器学习等。

  • 组织NLP项目的能力,以及对实际项目中需要涉及哪些步骤的理解。

  • 全面了解关键的自然语言处理,以及机器学习,术语。

  • 对自然语言处理可用资源和工具的全面知识。


本书的前两章向您介绍了自然语言处理领域和各种可用的NLP应用。它们还向您展示了如何用最少的NLP专业知识和技能构建自己的小型应用。如果你有兴趣在这个领域有一个快速的开始,我建议阅读这两章。后续的每一章都更深入地研究特定的NLP应用,因此,如果您对任何这样的特定应用感兴趣,您可以只关注特定的一章。如果你想全面了解这个领域、技术和应用,我建议你从头到尾阅读这本书:

  • 第1章介绍NLP领域及其各种任务和应用。它还简要概述了该领域的历史,并展示了NLP应用如何在我们的日常生活中使用。

  • 第2章解释了如何从头开始构建自己的实际NLP应用程序(垃圾邮件过滤),带您完成应用程序管道中的所有基本步骤。与此同时,本文介绍了一些基本的NLP技术,包括分词和文本规范化,并展示了如何通过流行的NLTK工具包在实践中使用它们。

  • 第三章主要讨论信息检索任务。它介绍了几个关键的NLP技术,如词干提取和停用词删除,并展示了如何实现自己的信息检索算法。它还解释了如何对这种算法进行评估。

  • 第4章探讨了信息提取并进一步介绍了一些基本技术,如词性标记、词元化和依赖分析。此外,还展示了如何使用另一个流行的NLP工具包spacacy构建信息提取应用程序。

  • 第5章展示了如何实现您自己的作者(或用户)分析算法,在NLTK和space中提供了进一步的示例和实践。此外,本文将该任务作为一个文本分类问题来呈现,并展示了如何使用流行的机器学习库scikit-learn实现一个机器学习分类器。

  • 第6章继续第5章开始的作者(用户)分析主题。它深入研究了语言特征工程的任务,这是任何自然语言处理项目中必不可少的一步。它展示了如何使用NLTK和space执行语言特征工程,以及如何评估文本分类算法的结果。

  • 第7章开始了情绪分析的主题,这是一个非常流行的NLP任务。它对任务应用了基于词典的方法。情感分析器是使用带有空间的语言管道构建的。

  • 第8章继续情感分析,但与第7章不同的是,它采用了数据驱动的方法来完成这项任务。使用scikit-learn应用了几种机器学习技术,并通过使用空间和NLTK语言资源引入了进一步的语言概念。

  • 第9章概述了主题分类的任务。与前面的文本分类任务相比,它是一个多类分类问题,因此本章讨论了这个任务的复杂性,并展示了如何使用scikit-learn实现一个主题分类器。此外,本文还采用了无监督机器学习的视角,并展示了如何将此任务作为聚类问题处理。

  • 第10章介绍了潜在狄利克雷分配(LDA)的主题建模任务。此外,本文还介绍了一个名为gensim的流行工具包,它特别适合使用主题建模算法。本文讨论了LDA方法的动机、实现细节和结果评估的技术。

  • 第11章以另一个称为名称实体识别(NER)的关键NLP任务结束本书。在介绍该任务的同时,本章还介绍了广泛用于NLP任务的一系列功能强大的序列标记方法,并展示了NER如何集成到进一步的下游NLP应用程序中。





专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“C424” 就可以获取【MIT博士论文】非参数因果推理的算法方法,424页pdf》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
25

相关内容

NLP:自然语言处理
【Manning2022新书】深度学习自然语言处理,296页pdf
专知会员服务
148+阅读 · 2022年10月25日
【Manning2022新书】TensorFlow实战,680页pdf
专知会员服务
102+阅读 · 2022年10月9日
【Manning新书】大规模数据结构和算法,306页pdf
专知会员服务
136+阅读 · 2022年5月30日
【Manning新书】自然语言处理实战:深度学习应用,337页pdf,
【Manning新书】TensorFlow机器学习,454页pdf
专知会员服务
103+阅读 · 2021年11月14日
【Manning新书】对话人工智能聊天机器人,319页pdf
专知会员服务
86+阅读 · 2021年11月8日
专知会员服务
123+阅读 · 2021年6月18日
【Manning2022新书】TensorFlow实战,680页pdf
专知
6+阅读 · 2022年10月9日
【2022新书】贝叶斯建模与Python建模
专知
17+阅读 · 2022年1月9日
【Manning新书】TensorFlow机器学习,第二版
专知
3+阅读 · 2021年11月14日
【Manning新书】高级算法与数据结构,769页pdf
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年11月18日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
【Manning2022新书】深度学习自然语言处理,296页pdf
专知会员服务
148+阅读 · 2022年10月25日
【Manning2022新书】TensorFlow实战,680页pdf
专知会员服务
102+阅读 · 2022年10月9日
【Manning新书】大规模数据结构和算法,306页pdf
专知会员服务
136+阅读 · 2022年5月30日
【Manning新书】自然语言处理实战:深度学习应用,337页pdf,
【Manning新书】TensorFlow机器学习,454页pdf
专知会员服务
103+阅读 · 2021年11月14日
【Manning新书】对话人工智能聊天机器人,319页pdf
专知会员服务
86+阅读 · 2021年11月8日
专知会员服务
123+阅读 · 2021年6月18日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员