【干货书】基于机器学习的文本挖掘：原理和技术，366页pdf - 专知VIP

会员服务 ·

44

机器学习 · 文本挖掘 · 书籍 ·

2023 年 1 月 7 日

【干货书】基于机器学习的文本挖掘：原理和技术，366页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本书对基于机器学习的方法在自然语言文本知识发现中的应用提供了一个视角。通过分析各种数据集，可以得出通常不明显的结论，并可用于各种目的和应用。本书解释了应用于文本挖掘的经过时间验证的机器学习算法的原理，并逐步演示了如何使用流行的R语言及其实现的机器学习算法揭示真实世界数据集中的语义内容。这本书不仅面向IT专家，而且面向更广泛的需要处理大量文本文档并具备该主题基本知识的读者，例如电子邮件服务提供商、在线购物者、图书管理员等。本书首先介绍了基于文本的自然语言数据处理及其目标和问题。它专注于机器学习，介绍各种算法及其用途和可能性，并回顾其优缺点。从初始数据预处理开始，读者可以按照R语言提供的步骤进行操作，包括将各种可用的插件包含到生成的软件工具中。一个很大的优势是R也包含许多实现机器学习算法的库，因此读者可以专注于主要目标，而无需自己实现算法的细节。为了更好地理解结果，本书还对算法进行了解释，以支持对结果的最终评估和解释。这些例子使用来自互联网的真实数据进行演示。 https://www.routledge.com/Text-Mining-with-Machine-Learning-Principles-and-Techniques/Zizka-Darena-Svoboda/p/book/9781032086217

成为VIP会员查看完整内容

67

相关内容

机器学习

“机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与统计推断学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。很多推论问题属于无程序可循难度，所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【干货书】预测:原理与实践，504页pdf

【干货书】预测:原理与实践，504页pdf

专知会员服务

95+阅读 · 2023年2月21日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知会员服务

126+阅读 · 2022年9月28日

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

专知会员服务

122+阅读 · 2022年5月19日

【干货书】Python机器学习，361页pdf

【干货书】Python机器学习，361页pdf

专知会员服务

271+阅读 · 2021年2月25日

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知会员服务

175+阅读 · 2020年6月4日

【2022新书】应用Python进行时间序列分析与预测，377页pdf

【2022新书】应用Python进行时间序列分析与预测，377页pdf

专知

24+阅读 · 2022年11月3日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知

23+阅读 · 2022年9月28日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

【干货书】深度学习全面指南，307页pdf

【干货书】深度学习全面指南，307页pdf

专知

32+阅读 · 2022年1月6日

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

专知

27+阅读 · 2020年3月24日

面向功能挖掘的代码主题建模技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于机器学习的软件调试技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

XQuery语言运行时自动程序例化技术的研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于分形与数据流挖掘技术的动态数据挖掘方法及其应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于数据挖掘方法的软件安全特性建模与分析

国家自然科学基金

1+阅读 · 2011年12月31日

Scene Graph Generation: A Comprehensive Survey

Arxiv

26+阅读 · 2022年1月3日

Updating Embeddings for Dynamic Knowledge Graphs

Arxiv

20+阅读 · 2021年9月22日

Building Intelligent Autonomous Navigation Agents

Arxiv

25+阅读 · 2021年6月25日

A Survey on Deep Learning for Named Entity Recognition

A Survey on Deep Learning for Named Entity Recognition

Arxiv

73+阅读 · 2018年12月22日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

VIP会员

相关主题

相关VIP内容

【干货书】预测:原理与实践，504页pdf

【干货书】预测:原理与实践，504页pdf

专知会员服务

95+阅读 · 2023年2月21日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知会员服务

126+阅读 · 2022年9月28日

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

专知会员服务

122+阅读 · 2022年5月19日

【干货书】Python机器学习，361页pdf

【干货书】Python机器学习，361页pdf

专知会员服务

271+阅读 · 2021年2月25日

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知会员服务

175+阅读 · 2020年6月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【MIT博士论文】弱监督学习：理论、方法与应用

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

锚定情报：合成欺骗时代的地面真相

NeurIPS 2025 | NMKE：基于神经元归因与动态稀疏掩码的终身知识编辑

相关资讯

【2022新书】应用Python进行时间序列分析与预测，377页pdf

【2022新书】应用Python进行时间序列分析与预测，377页pdf

专知

24+阅读 · 2022年11月3日

【干货书】现代统计学:使用Python的计算机方法，452页pdf

【干货书】现代统计学:使用Python的计算机方法，452页pdf

专知

23+阅读 · 2022年9月28日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

【干货书】深度学习全面指南，307页pdf

【干货书】深度学习全面指南，307页pdf

专知

32+阅读 · 2022年1月6日

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

【干货书】使用Python进行高级数据分析，195页pdf，以机器学习、深度学习和NLP为例

专知

27+阅读 · 2020年3月24日

相关基金

面向功能挖掘的代码主题建模技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于机器学习的软件调试技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

XQuery语言运行时自动程序例化技术的研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于分形与数据流挖掘技术的动态数据挖掘方法及其应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于数据挖掘方法的软件安全特性建模与分析

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Scene Graph Generation: A Comprehensive Survey

Arxiv

26+阅读 · 2022年1月3日

Updating Embeddings for Dynamic Knowledge Graphs

Arxiv

20+阅读 · 2021年9月22日

Building Intelligent Autonomous Navigation Agents

Arxiv

25+阅读 · 2021年6月25日

A Survey on Deep Learning for Named Entity Recognition

A Survey on Deep Learning for Named Entity Recognition

Arxiv

73+阅读 · 2018年12月22日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

微信扫码咨询专知VIP会员