随着对机器学习和编程专业人员的需求不断增加,现在是投资该领域的黄金时间。本书将帮助你做到这一点,通过在各种介绍复杂理论概念的教科书或过度关注Python代码的教科书之间走中间路线,特别关注文本数据和人类语言。
https://www.packtpub.com/product/machine-learning-techniques-for-text/9781803242385
这项工作所建立的一个很好的比喻是经验丰富的工匠和他们的学员之间的关系。前者针对当前存在的问题,从工具箱中选择一种工具,说明其效用,并付诸实施;这种方法将帮助您确定所介绍的每种方法或技术的至少一种实际用途。内容分为十章,每一章讨论一个具体的案例研究。因此,本书以解决方案为导向。它还以Jupyter notebook的形式提供了Python代码,以帮助您获得实践经验。本书各章重复出现的一个模式是帮助你对数据有一些直觉,然后实现和对比不同的解决方案。
读完本书后,你将能够理解和应用Python的各种技术,包括文本预处理、文本表示、降维、机器学习、语言建模、可视化和评估。
创造可以从数据中学习来执行智能决策的机器正在成为许多技术领域的主导范式。获得完成这项任务所需的技能肯定会促进你的职业生涯。面向文本的机器学习技术旨在帮助您完成这一工作,特别是专注于文本数据和人类语言。本书将向你展示如何分析文本数据,如何开始机器学习,以及如何高效地使用经常用于这些任务的Python库,如pandas、NumPy、matplotlib、seaborn和scikit-learn。您还将有机会使用最先进的深度学习框架,如TensorFlow, Keras和PyTorch。有大量的资源可以帮助你掌握文本机器学习领域的知识,包括复杂的理论概念,这些概念通常用要求严格的数学语言表达。相反,其他资源过多地集中在Python代码上,而设计选择背后的理论基础仍然很浅薄。