本书对基于机器学习的方法在自然语言文本知识发现中的应用提供了一个视角。通过分析各种数据集,可以得出通常不明显的结论,并可用于各种目的和应用。本书解释了应用于文本挖掘的经过时间验证的机器学习算法的原理,并逐步演示了如何使用流行的R语言及其实现的机器学习算法揭示真实世界数据集中的语义内容。这本书不仅面向IT专家,而且面向更广泛的需要处理大量文本文档并具备该主题基本知识的读者,例如电子邮件服务提供商、在线购物者、图书管理员等。 本书首先介绍了基于文本的自然语言数据处理及其目标和问题。它专注于机器学习,介绍各种算法及其用途和可能性,并回顾其优缺点。从初始数据预处理开始,读者可以按照R语言提供的步骤进行操作,包括将各种可用的插件包含到生成的软件工具中。一个很大的优势是R也包含许多实现机器学习算法的库,因此读者可以专注于主要目标,而无需自己实现算法的细节。为了更好地理解结果,本书还对算法进行了解释,以支持对结果的最终评估和解释。这些例子使用来自互联网的真实数据进行演示。 https://www.routledge.com/Text-Mining-with-Machine-Learning-Principles-and-Techniques/Zizka-Darena-Svoboda/p/book/9781032086217

成为VIP会员查看完整内容
47

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】金融信号处理与机器学习,440页pdf
专知会员服务
39+阅读 · 1月15日
【Manning新书】自然语言处理入门,458页pdf
专知会员服务
69+阅读 · 2022年9月22日
【干货书】优化算法,232页pdf
专知会员服务
132+阅读 · 2022年9月8日
【新书】机器学习算法,模型与应用,154页pdf
专知会员服务
67+阅读 · 2022年1月20日
【干货书】机器学习算法视角,249页pdf
专知会员服务
104+阅读 · 2021年10月18日
专知会员服务
102+阅读 · 2021年6月18日
【干货书】Python机器学习,361页pdf
专知会员服务
213+阅读 · 2021年2月25日
【干货书】高级应用深度学习,294页pdf
专知会员服务
121+阅读 · 2020年6月20日
【新书】傻瓜式入门深度学习,371页pdf
专知会员服务
168+阅读 · 2019年12月28日
【干货书】因果推理基础:R语言,249页pdf
专知
0+阅读 · 2022年10月22日
【Manning新书】自然语言处理入门,458页pdf
【干货书】优化算法,232页pdf
专知
1+阅读 · 2022年9月8日
国家自然科学基金
9+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
Arxiv
0+阅读 · 1月27日
Arxiv
30+阅读 · 2022年5月23日
Arxiv
21+阅读 · 2022年3月28日
Arxiv
44+阅读 · 2021年5月3日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Few-shot Learning: A Survey
Arxiv
351+阅读 · 2019年4月10日
Arxiv
16+阅读 · 2018年8月30日
VIP会员
相关VIP内容
【干货书】金融信号处理与机器学习,440页pdf
专知会员服务
39+阅读 · 1月15日
【Manning新书】自然语言处理入门,458页pdf
专知会员服务
69+阅读 · 2022年9月22日
【干货书】优化算法,232页pdf
专知会员服务
132+阅读 · 2022年9月8日
【新书】机器学习算法,模型与应用,154页pdf
专知会员服务
67+阅读 · 2022年1月20日
【干货书】机器学习算法视角,249页pdf
专知会员服务
104+阅读 · 2021年10月18日
专知会员服务
102+阅读 · 2021年6月18日
【干货书】Python机器学习,361页pdf
专知会员服务
213+阅读 · 2021年2月25日
【干货书】高级应用深度学习,294页pdf
专知会员服务
121+阅读 · 2020年6月20日
【新书】傻瓜式入门深度学习,371页pdf
专知会员服务
168+阅读 · 2019年12月28日
相关基金
国家自然科学基金
9+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2008年12月31日
相关论文
Arxiv
0+阅读 · 1月27日
Arxiv
30+阅读 · 2022年5月23日
Arxiv
21+阅读 · 2022年3月28日
Arxiv
44+阅读 · 2021年5月3日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Few-shot Learning: A Survey
Arxiv
351+阅读 · 2019年4月10日
Arxiv
16+阅读 · 2018年8月30日
微信扫码咨询专知VIP会员