【2020新书】现代数据挖掘算法C++和CUDA，233页pdf，数据科学的特征提取和选择算法的最新发展 - 专知VIP

会员服务 ·

15

现代数据挖掘 · IT新书 ·

2020 年 6 月 11 日

【2020新书】现代数据挖掘算法C++和CUDA，233页pdf，数据科学的特征提取和选择算法的最新发展

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

发现各种有用的数据挖掘算法，这些算法可以从庞大的候选数据中选择小的重要特征集，或者从测量变量中提取有用的特征。

作为一个严谨的数据挖掘程序员，您将经常面对数以千计的候选特征，用于您的预测或分类应用程序，其中大多数特征几乎没有价值或没有价值。您将知道，其中许多特征可能只有在与某些其他特征结合时才有用，而单独使用或与大多数其他特征结合时实际上是毫无价值的。有些特征可能具有巨大的预测能力，但只能在特征空间的一个小的、专门的领域内。这本书通过介绍现代的特性选择技术和实现这些技术的代码来帮助您解决这个问题。其中一些技巧是:

正向选择分量分析
当地的特征选择
使用隐马尔可夫模型连接特征和目标

所有算法都得到了直观的证明，并得到了相关方程和解释材料的支持。作者还提供并解释了完整的、高度注释的源代码。

示例代码是C++和CUDA C，但Python或其他代码可以替换;重要的是算法，而不是用来编写算法的代码。

你将学到什么

将主成分分析与向前和向后的逐步选择相结合，以确定在整个集合中捕获最大可能变异的大量变量集合的一个紧凑子集。
识别仅对特征域的一个小子集具有预测能力的特征。这些特征可以被现代预测模型有效地利用，但可能被其他特征选择方法所遗漏。
找出同时控制特征变量和目标分布的隐含马尔可夫模型。这种方法固有的记忆在高噪音应用中尤其有价值，例如金融市场的预测。

这本书是给谁的

中级到高级数据科学程序员和分析师。强烈推荐有c++和CUDA C的经验。然而，这本书可以作为框架使用其他语言，如Python。

成为VIP会员查看完整内容

76

相关内容

现代数据挖掘

现代数据挖掘

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

270+阅读 · 2020年6月10日

【2020新书】数据科学:十大Python项目，247页pdf

【2020新书】数据科学:十大Python项目，247页pdf

专知会员服务

216+阅读 · 2020年2月21日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

【新书】Pro 机器学习算法Python实现，379页pdf

【新书】Pro 机器学习算法Python实现，379页pdf

专知会员服务

204+阅读 · 2020年2月11日

新书《面向机器学习和数据分析的特征工程》，419页pdf

新书《面向机器学习和数据分析的特征工程》，419页pdf

专知会员服务

144+阅读 · 2019年10月10日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

面向机器学习和数据分析的特征工程，附新书419页pdf

面向机器学习和数据分析的特征工程，附新书419页pdf

专知

93+阅读 · 2019年10月5日

用Python实现流行机器学习算法

用Python实现流行机器学习算法

Python程序员

21+阅读 · 2018年12月31日

报名 | 恰到好处的机器学习入门课，一站搞定基础+算法+实战

报名 | 恰到好处的机器学习入门课，一站搞定基础+算法+实战

机器之心

18+阅读 · 2018年7月17日

教程 | 算法太多挑花眼？教你如何选择正确的机器学习算法

教程 | 算法太多挑花眼？教你如何选择正确的机器学习算法

机器之心

9+阅读 · 2018年7月1日

A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

Arxiv

100+阅读 · 2020年2月20日

A Survey on Distributed Machine Learning

Arxiv

45+阅读 · 2019年12月20日

Accelerated Methods for Deep Reinforcement Learning

Accelerated Methods for Deep Reinforcement Learning

Arxiv

6+阅读 · 2019年1月10日

Unsupervised Meta-Learning for Reinforcement Learning

Arxiv

8+阅读 · 2018年6月12日

MatchZoo: A Toolkit for Deep Text Matching

Arxiv

5+阅读 · 2017年7月23日

VIP会员

相关主题

现代数据挖掘

相关VIP内容

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

270+阅读 · 2020年6月10日

【2020新书】数据科学:十大Python项目，247页pdf

【2020新书】数据科学:十大Python项目，247页pdf

专知会员服务

216+阅读 · 2020年2月21日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

【新书】Pro 机器学习算法Python实现，379页pdf

【新书】Pro 机器学习算法Python实现，379页pdf

专知会员服务

204+阅读 · 2020年2月11日

新书《面向机器学习和数据分析的特征工程》，419页pdf

新书《面向机器学习和数据分析的特征工程》，419页pdf

专知会员服务

144+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

面向作战人员负责任地寻求生成式人工智能

《Hello-Agents》项目正式发布，一起从零学习智能体！

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

相关资讯

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

面向机器学习和数据分析的特征工程，附新书419页pdf

面向机器学习和数据分析的特征工程，附新书419页pdf

专知

93+阅读 · 2019年10月5日

用Python实现流行机器学习算法

用Python实现流行机器学习算法

Python程序员

21+阅读 · 2018年12月31日

报名 | 恰到好处的机器学习入门课，一站搞定基础+算法+实战

报名 | 恰到好处的机器学习入门课，一站搞定基础+算法+实战

机器之心

18+阅读 · 2018年7月17日

教程 | 算法太多挑花眼？教你如何选择正确的机器学习算法

教程 | 算法太多挑花眼？教你如何选择正确的机器学习算法

机器之心

9+阅读 · 2018年7月1日

相关论文

A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

Arxiv

100+阅读 · 2020年2月20日

A Survey on Distributed Machine Learning

Arxiv

45+阅读 · 2019年12月20日

Accelerated Methods for Deep Reinforcement Learning

Accelerated Methods for Deep Reinforcement Learning

Arxiv

6+阅读 · 2019年1月10日

Unsupervised Meta-Learning for Reinforcement Learning

Arxiv

8+阅读 · 2018年6月12日

MatchZoo: A Toolkit for Deep Text Matching

Arxiv

5+阅读 · 2017年7月23日

微信扫码咨询专知VIP会员