深入机器学习模型的超参数调整,关注什么是超参数以及它们是如何工作的。这本书讨论了不同的超参数调优技术,从基础到高级方法。

这是一个关于超参数优化的分步指南,从什么是超参数以及它们如何影响机器学习模型的不同方面开始。然后介绍一些基本的超参数优化算法。此外,作者利用分布式优化方法解决了时间和内存约束的问题。接下来您将讨论超参数搜索的贝叶斯优化,它从以前的历史中吸取了教训。

这本书讨论了不同的框架,如Hyperopt和Optuna,它实现了基于顺序模型的全局优化(SMBO)算法。在这些讨论中,您将关注不同的方面,比如搜索空间的创建和这些库的分布式优化。

机器学习中的超参数优化有助于理解这些算法是如何工作的,以及如何在现实数据科学问题中使用它们。最后一章总结了超参数优化在自动机器学习中的作用,并以一个创建自己的自动脚本的教程结束。

超参数优化是一项冗长乏味的任务,所以请坐下来,让这些算法来完成您的工作。你将学到什么

  • 了解超参数中的更改如何影响模型的性能。
  • 对数据科学问题应用不同的超参数调优算法
  • 使用贝叶斯优化方法来创建高效的机器学习和深度学习模型
  • 使用计算机集群分发超参数优化
  • 利用超参数优化方法实现机器自动学习

这本书是给谁的

  • 从事机器学习的专业人员和学生。

在构建机器学习模型时选择正确的超参数是数据科学从业者面临的最大问题之一。这本书是超参数优化(HPO)的指南。它从超参数的最基本定义开始,并带您使用高级HPO技术构建您自己的AutoML脚本。这本书是打算为学生和数据科学专业人员。这本书由五章组成。

  • 第1章帮助您理解超参数是如何影响模型构建的整个过程的。它告诉我们HPO的重要性。
  • 第2章介绍了基本且易于实现的HPO方法。
  • 第3章介绍了解决时间和内存限制的各种技术。
  • 第4章和第5章讨论了贝叶斯优化、相关库和AutoML。

这本书的目的是让读者以一种直观和实用的方式来理解HPO的概念,每个部分都提供了代码实现。我希望你能喜欢。

成为VIP会员查看完整内容
1
83

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

获得金融、医疗保健和零售领域的机器学习实用技能。这本书通过提供这些领域的案例研究,使用了动手的方法:你将看到如何使用机器学习作为商业增强工具的例子。作为一名领域专家,您不仅会发现机器学习在金融、医疗保健和零售领域是如何应用的,而且还会通过实施机器学习的实际案例研究进行工作。

使用Python的机器学习应用程序分为三个部分,分别针对每个领域(医疗保健、金融和零售)。每一节都以机器学习和该领域的关键技术进展的概述开始。然后,您将通过案例研究了解更多关于组织如何改变其所选择市场的游戏规则。这本书有实际的案例研究与Python代码和领域特定的创新想法赚钱的机器学习。

你会学到什么

  • 发现应用的机器学习过程和原理
  • 在医疗保健、金融和零售领域实现机器学习
  • 避免应用机器学习的陷阱
  • 在三个主题领域构建Python机器学习示例

这本书是给谁的

  • 数据科学家和机器学习专家。
成为VIP会员查看完整内容
0
80

学习设计、构建和部署由机器学习(ML)支持的应用程序所必需的技能。通过这本亲力亲为的书,您将构建一个示例ML驱动的应用程序,从最初的想法到部署的产品。数据科学家、软件工程师和产品经理—包括有经验的实践者和新手—将逐步学习构建真实的ML应用程序所涉及的工具、最佳实践和挑战。

作者Emmanuel Ameisen是一位经验丰富的数据科学家,他领导了一个人工智能教育项目,通过代码片段、插图、截图和对行业领袖的采访展示了实用的ML概念。第1部分将告诉您如何计划ML应用程序并度量成功。第2部分解释了如何构建一个工作的ML模型。第三部分演示了改进模型的方法,直到它满足您最初的设想。第4部分介绍部署和监控策略。

这本书会对你有所帮助:

  • 定义你的产品目标,设置一个机器学习问题
  • 快速构建第一个端到端管道并获取初始数据集
  • 训练和评估您的ML模型并解决性能瓶颈
  • 在生产环境中部署和监控您的模型

成为VIP会员查看完整内容
0
38

这本书是关于运用机器和深度学习来解决石油和天然气行业的一些挑战。这本书开篇简要讨论石油和天然气勘探和生产生命周期中不同阶段的数据流工业操作。这导致了对一些有趣问题的调查,这些问题很适合应用机器和深度学习方法。最初的章节提供了Python编程语言的基础知识,该语言用于实现算法;接下来是监督和非监督机器学习概念的概述。作者提供了使用开源数据集的行业示例以及对算法的实际解释,但没有深入研究所使用算法的理论方面。石油和天然气行业中的机器学习涵盖了包括地球物理(地震解释)、地质建模、油藏工程和生产工程在内的各种行业主题。

在本书中,重点在于提供一种实用的方法,提供用于实现机器的逐步解释和代码示例,以及用于解决油气行业现实问题的深度学习算法。

你将学到什么

  • 了解石油和天然气行业的端到端的行业生命周期和数据流
  • 了解计算机编程和机器的基本概念,以及实现所使用的算法所需的深度学习
  • 研究一些有趣的行业问题,这些问题很有可能被机器和深度学习解决
  • 发现在石油和天然气行业中执行机器和深度学习项目的实际考虑和挑战

这本书是给谁的

  • 石油和天然气行业的专业人员,他们可以受益于对机器的实际理解和解决现实问题的深度学习方法。
成为VIP会员查看完整内容
0
66

使用高级架构开发和优化深度学习模型。这本书教你错综复杂的细节和微妙的算法,是卷积神经网络的核心。在高级应用深度学习中,您将学习CNN的高级主题和使用Keras和TensorFlow的对象检测。

在此过程中,您将了解CNN中的基本操作,如卷积和池化,然后了解更高级的架构,如inception networks、resnets等等。当这本书讨论理论主题时,你会发现如何有效地与Keras工作,其中有许多技巧和提示,包括如何用自定义回调类自定义Keras登录,什么是迫切执行,以及如何在你的模型中使用它。最后,您将学习对象检测是如何工作的,并在Keras和TensorFlow中构建YOLO(只查看一次)算法的完整实现。在书的最后,你将实现各种各样的模型在Keras和学习许多高级技巧,将把你的技能到下一个水平。

你将学到什么

  • 看看卷积神经网络和目标检测是如何工作的
  • 在磁盘上的权值和模型
  • 暂停训练,在稍后的阶段重新开始
  • 在代码中使用硬件加速
  • 使用数据集TensorFlow抽象和使用预先训练的模型和迁移学习
  • 删除和添加层到预先训练的网络,使其适应您的特定项目
  • 将预先训练好的模型(如Alexnet和VGG16)应用到新的数据集

这本书是给谁的

  • 拥有中级到高级Python和机器学习技能的科学家和研究人员。此外,还需要Keras和TensorFlow的中级知识。
成为VIP会员查看完整内容
0
84

有兴趣的数据科学专业人士可以通过本书学习Scikit-Learn图书馆以及机器学习的基本知识。本书结合了Anaconda Python发行版和流行的Scikit-Learn库,演示了广泛的有监督和无监督机器学习算法。通过用Python编写的清晰示例,您可以在家里自己的机器上试用和试验机器学习的原理。

所有的应用数学和编程技能需要掌握的内容,在这本书中涵盖。不需要深入的面向对象编程知识,因为工作和完整的例子被提供和解释。必要时,编码示例是深入和复杂的。它们也简洁、准确、完整,补充了介绍的机器学习概念。使用示例有助于建立必要的技能,以理解和应用复杂的机器学习算法。

对于那些在机器学习方面追求职业生涯的人来说,Scikit-Learn机器学习应用手册是一个很好的起点。学习这本书的学生将学习基本知识,这是胜任工作的先决条件。读者将接触到专门为数据科学专业人员设计的蟒蛇分布,并将在流行的Scikit-Learn库中构建技能,该库是Python世界中许多机器学习应用程序的基础。

你将学习

  • 使用Scikit-Learn中常见的简单和复杂数据集
  • 将数据操作为向量和矩阵,以进行算法处理
  • 熟悉数据科学中使用的蟒蛇分布
  • 应用带有分类器、回归器和降维的机器学习
  • 优化算法并为每个数据集找到最佳算法
  • 从CSV、JSON、Numpy和panda格式加载数据并保存为这些格式

这本书是给谁的

  • 有抱负的数据科学家渴望通过掌握底层的基础知识进入机器学习领域,而这些基础知识有时在急于提高生产力的过程中被忽略了。一些面向对象编程的知识和非常基本的线性代数应用将使学习更容易,尽管任何人都可以从这本书获益。
成为VIP会员查看完整内容
0
155

理解并实施panda的大数据分析解决方案,强调性能。本书通过探索其底层实现和数据结构,增强了您使用Python数据分析库pandas的直觉。

《Pandas 编程思想》介绍了大数据的主题,并通过观看pandas帮助解决的激动人心和有影响力的项目来展示概念。从那里,您将学习按大小和类型评估您自己的项目,以确定pandas是否适合您的需要。作者Hannah Stepanek解释了如何在pandas中有效地加载和规范化数据,并回顾了一些最常用的加载器和它们的几个最强大的选项。然后,您将了解如何有效地访问和转换数据,应该避免哪些方法,以及何时使用更高级的性能技术。您还将学习基本的数据访问、学习panda和直观的字典语法。此外,还讨论了如何选择正确的DataFrame格式、使用多层次的DataFrame以及将来如何改进panda。

在本书结束时,您将对pandas库的底层工作原理有一个牢固的理解。准备好用正确的方法在你自己的项目中做出自信的决定。

你将学到什么

  • 理解pandas的底层数据结构,以及为什么在某些情况下它会这样执行
  • 了解如何使用pandas正确地提取、转换和加载数据,重点关注性能
  • 选择正确的数据格式,使数据分析简单有效。
  • 使用其他Python库提高pandas操作的性能

这本书是给谁的

  • 具有基本Python编程技能的软件工程师热衷于在大数据分析项目中使用pandas。Python软件开发人员对大数据感兴趣。
成为VIP会员查看完整内容
0
97

改进您的编程技术和方法,成为一个更有生产力和创造性的Python程序员。本书探索了一些概念和特性,这些概念和特性不仅将改进您的代码,而且还将帮助您理解Python社区,并对Python哲学有深入的了解和详细的介绍。

专业的Python 3,第三版给你的工具写干净,创新的代码。它首先回顾了一些核心的Python原则,这些原则将在本书后面的各种概念和示例中进行说明。本书的前半部分探讨了函数、类、协议和字符串的各个方面,描述了一些技术,这些技术可能不是常见的知识,但它们共同构成了坚实的基础。后面的章节涉及文档、测试和应用程序分发。在此过程中,您将开发一个复杂的Python框架,该框架将整合在本书中所学到的思想。

这个版本的更新包括Python 3中迭代器的角色、用Scrapy和BeautifulSoup进行web抓取、使用请求调用没有字符串的web页面、用于分发和安装的新工具等等。在本书的最后,您将准备好部署不常见的特性,这些特性可以将您的Python技能提升到下一个级别。

你将学习

  • 用各种类型的Python函数实现程序
  • 使用类和面向对象编程
  • 使用标准库和第三方库中的字符串
  • 使用Python获取web站点数据
  • 通过编写测试套件来自动化单元测试
  • 回顾成像、随机数生成和NumPy科学扩展
  • 理解Python文档的精髓,以帮助您决定分发代码的最佳方式

这本书是给谁看的 熟悉Python的中级程序员,希望提升到高级水平。您应该至少编写了一个简单的Python应用程序,并且熟悉基本的面向对象方法、使用交互式解释器和编写控制结构。

成为VIP会员查看完整内容
0
141

找到有合适技能的人。本书阐明了创建高效能数据集成团队的最佳实践,使您能够理解计划、设计和监视一次性迁移和日常集成系统的技能和需求、文档和解决方案。

数据的增长是爆炸式的。随着跨企业系统的多个信息源的不断到达,将这些系统组合成一个单一的、内聚的、可记录的单元变得比以往任何时候都更加重要。但是,与其他软件规程相比,集成的方法有很大的不同,它要求能够编写代码、协作并将复杂的业务规则分解为可伸缩的模型。

数据迁移和集成可能很复杂。在许多情况下,项目团队将实际的迁移保留到项目的最后一个周末,任何问题都可能导致错过最后期限,或者在最坏的情况下导致需要在部署后进行协调的数据损坏。本书详细介绍了如何进行战略规划以避免这些最后时刻的风险,以及如何为未来的集成项目构建正确的解决方案。

你会学到什么

  • 理解集成的“语言”,以及它们在优先级和所有权方面的关系
  • 创建有价值的文档,带领您的团队从发现到部署
  • 研究当今市场上最重要的集成工具
  • 监视您的错误日志,并查看输出如何增加持续改进的周期
  • 为整个企业提供有价值的集成解决方案

这本书是给谁看的

构建相应实践的执行和集成团队领导。它也适用于需要额外熟悉ETL工具、集成过程和相关项目可交付成果的集成架构师、开发人员和业务分析人员

成为VIP会员查看完整内容
0
63

简介:

科学专业人员可以通过本书学习Scikit-Learn库以及机器学习的基础知识。该书将Anaconda Python发行版与流行的Scikit-Learn库结合在一起,展示了各种有监督和无监督的机器学习算法。通过Python编写的清晰示例向读者介绍机器学习的原理,以及相关代码。

本书涵盖了掌握这些内容所需的所有应用数学和编程技能。不需要深入的面向对象编程知识,因为可以提供并说明完整的示例。必要时,编码示例很深入且很复杂。它们也简洁,准确,完整,是对引入的机器学习概念的补充。处理示例有助于建立理解和应用复杂机器学习算法所需的技能。

本书的学生将学习作为胜任力前提的基础知识。读者将了解专门为数据科学专业人员设计的Python Anaconda发行版,并将在流行的Scikit-Learn库中构建技能,该库是Python领域许多机器学习应用程序的基础。

本书内容包括:

  • 使用Scikit-Learn通用的简单和复杂数据集
  • 将数据处理为向量和矩阵以进行算法处理
  • 熟悉数据科学中使用的Anaconda发行版
  • 通过分类器,回归器和降维应用机器学习
  • 调整算法并为每个数据集找到最佳算法
  • 从CSV,JSON,Numpy和Pandas格式加载数据并保存

内容介绍:

这本书分为八章。 第1章介绍了机器学习,Anaconda和Scikit-Learn的主题。 第2章和第3章介绍算法分类。 第2章对简单数据集进行分类,第3章对复杂数据集进行分类。 第4章介绍了回归预测模型。 第5章和第6章介绍分类调整。 第5章调整简单数据集,第6章调整复杂数据集。 第7章介绍了预测模型回归调整。 第8章将所有知识汇总在一起,以整体方式审查和提出发现。

作者介绍:

David Paper博士是犹他州立大学管理信息系统系的教授。他写了两本书-商业网络编程:Oracle的PHP面向对象编程和Python和MongoDB的数据科学基础。他在诸如组织研究方法,ACM通讯,信息与管理,信息资源管理期刊,AIS通讯,信息技术案例与应用研究期刊以及远程计划等参考期刊上发表了70余篇论文。他还曾在多个编辑委员会担任过各种职务,包括副编辑。Paper博士还曾在德州仪器(TI),DLS,Inc.和凤凰城小型企业管理局工作。他曾为IBM,AT&T,Octel,犹他州交通运输部和空间动力实验室执行过IS咨询工作。 Paper博士的教学和研究兴趣包括数据科学,机器学习,面向对象的程序设计和变更管理。

目录:

成为VIP会员查看完整内容
0
78
小贴士
相关VIP内容
专知会员服务
80+阅读 · 1月1日
专知会员服务
38+阅读 · 2020年12月1日
专知会员服务
66+阅读 · 2020年11月3日
专知会员服务
84+阅读 · 2020年6月20日
专知会员服务
155+阅读 · 2020年6月10日
专知会员服务
126+阅读 · 2020年2月11日
相关论文
Xiaoyang Wang,Bo Li,Yibo Zhang,Bhavya Kailkhura,Klara Nahrstedt
1+阅读 · 1月15日
Oliver Hines,Stijn Vansteelandt,Karla Diaz-Ordaz
0+阅读 · 1月13日
Prithviraj Ammanabrolu,Wesley Cheung,William Broniec,Mark O. Riedl
7+阅读 · 2020年12月30日
Yantao Shen,Yuanjun Xiong,Wei Xia,Stefano Soatto
5+阅读 · 2020年3月26日
Hyper-Parameter Optimization: A Review of Algorithms and Applications
Tong Yu,Hong Zhu
12+阅读 · 2020年3月12日
Optimization for deep learning: theory and algorithms
Ruoyu Sun
79+阅读 · 2019年12月19日
Bernhard Schölkopf
9+阅读 · 2019年11月24日
A Survey on Explainable Artificial Intelligence (XAI): Towards Medical XAI
Erico Tjoa,Cuntai Guan
3+阅读 · 2019年10月15日
Towards Automated Machine Learning: Evaluation and Comparison of AutoML Approaches and Tools
Anh Truong,Austin Walters,Jeremy Goodsitt,Keegan Hines,C. Bayan Bruss,Reza Farivar
3+阅读 · 2019年9月3日
Towards Understanding Regularization in Batch Normalization
Ping Luo,Xinjiang Wang,Wenqi Shao,Zhanglin Peng
4+阅读 · 2018年9月27日
Top