本书对基于机器学习的方法在自然语言文本知识发现中的应用提供了一个视角。通过分析各种数据集,可以得出通常不明显的结论,并可用于各种目的和应用。本书解释了应用于文本挖掘的经过时间验证的机器学习算法的原理,并逐步演示了如何使用流行的R语言及其实现的机器学习算法揭示真实世界数据集中的语义内容。这本书不仅面向IT专家,而且面向更广泛的需要处理大量文本文档并具备该主题基本知识的读者,例如电子邮件服务提供商、在线购物者、图书管理员等。 本书首先介绍了基于文本的自然语言数据处理及其目标和问题。它专注于机器学习,介绍各种算法及其用途和可能性,并回顾其优缺点。从初始数据预处理开始,读者可以按照R语言提供的步骤进行操作,包括将各种可用的插件包含到生成的软件工具中。一个很大的优势是R也包含许多实现机器学习算法的库,因此读者可以专注于主要目标,而无需自己实现算法的细节。为了更好地理解结果,本书还对算法进行了解释,以支持对结果的最终评估和解释。这些例子使用来自互联网的真实数据进行演示。 https://www.routledge.com/Text-Mining-with-Machine-Learning-Principles-and-Techniques/Zizka-Darena-Svoboda/p/book/9781032086217

成为VIP会员查看完整内容
65

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】预测:原理与实践,504页pdf
专知会员服务
91+阅读 · 2023年2月21日
【干货书】机器学习理论与实践,299页pdf
专知会员服务
96+阅读 · 2022年12月5日
【干货书】现代统计学:使用Python的计算机方法,452页pdf
专知会员服务
123+阅读 · 2022年9月28日
【干货书】Python机器学习,361页pdf
专知会员服务
266+阅读 · 2021年2月25日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
专知会员服务
171+阅读 · 2020年6月4日
【干货书】因果推理基础:R语言,249页pdf
专知
2+阅读 · 2022年10月22日
【干货书】深度学习全面指南,307页pdf
专知
31+阅读 · 2022年1月6日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年3月2日
Arxiv
13+阅读 · 2022年10月20日
Arxiv
57+阅读 · 2022年1月5日
Arxiv
25+阅读 · 2022年1月3日
Arxiv
20+阅读 · 2021年9月22日
Arxiv
24+阅读 · 2021年6月25日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Arxiv
26+阅读 · 2018年8月19日
VIP会员
相关VIP内容
【干货书】预测:原理与实践,504页pdf
专知会员服务
91+阅读 · 2023年2月21日
【干货书】机器学习理论与实践,299页pdf
专知会员服务
96+阅读 · 2022年12月5日
【干货书】现代统计学:使用Python的计算机方法,452页pdf
专知会员服务
123+阅读 · 2022年9月28日
【干货书】Python机器学习,361页pdf
专知会员服务
266+阅读 · 2021年2月25日
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
专知会员服务
171+阅读 · 2020年6月4日
相关基金
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2023年3月2日
Arxiv
13+阅读 · 2022年10月20日
Arxiv
57+阅读 · 2022年1月5日
Arxiv
25+阅读 · 2022年1月3日
Arxiv
20+阅读 · 2021年9月22日
Arxiv
24+阅读 · 2021年6月25日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Arxiv
26+阅读 · 2018年8月19日
微信扫码咨询专知VIP会员