简化数据科学基础设施,为数据科学家提供从原型到生产的有效路径。 《高效数据科学基础》是为数据科学和机器学习应用程序组装基础设施的实践指南。它揭示了Netflix和其他数据驱动公司管理尖端数据基础设施的过程。

当您使用这个易于遵循的指南时,您将从头开始设置端到端基础设施,使用一个完全可定制的流程,您可以很容易地适应您的公司。您将了解如何使用现有的云基础设施、一堆开源软件和惯用的Python提高数据科学家的工作效率。在整个过程中,您将遵循以人为中心的方法,重点关注用户体验和满足数据科学家的独特需求。

第一章: 介绍 第二章: 数据科学的工具链 第三章: 介绍Metaflow 第四章: 计算层的扩展 第五章: 实践可扩展和性能 第六章: 进入生产阶段 第七章: 处理数据 第八章: 使用和运作模式 第九章: 使用完整堆栈的机器学习

机器学习和数据科学应用是人类构建的最复杂的工程产品,如果你考虑到驱动它们的全部软件和硬件堆栈的话。因此,在今天,在21世纪20年代初,构建这样的应用并不容易,这就不足为奇了。机器学习和数据科学将继续存在。由高级数据驱动技术驱动的应用程序在各个行业中越来越普遍。因此,显然需要使构建和操作这样的应用程序成为一个更轻松、更有纪律的过程。引用阿尔弗雷德·怀特黑德的话:“文明的进步是通过扩展我们无需思考就能执行的重要操作的数量。”这本书教你如何构建一个有效的数据科学基础设施,它允许用户试验创新的应用,将它们部署到生产中,并不断改进它们,而不需要过多考虑技术细节。没有一种千篇一律的方法可以适用于所有的用例。因此,本书关注的是通用的、基本的原则和组件,这些原则和组件可以在您的环境中以一种有意义的方式实现。

https://www.manning.com/books/effective-data-science-infrastructure#:~:text=Effective%20Data%20Science%20Infrastructure%3A%20How,their%20cutting%20edge%20data%20infrastructure.

成为VIP会员查看完整内容
75

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【2022新书】机器学习的实用模拟与合成,428页pdf
专知会员服务
98+阅读 · 2022年8月10日
【2022新书】机器学习与数据科学:基础与应用,272页pdf
专知会员服务
108+阅读 · 2022年8月3日
【Manning新书】MLOps工程规模化,344页pdf
专知会员服务
79+阅读 · 2022年5月4日
【干货书】数据科学家统计学基础:R和Python实战,486页pdf
【2021新书】面向对象的Python编程,418页pdf
专知会员服务
70+阅读 · 2021年12月15日
【Manning新书】高级算法与数据结构,769页pdf
专知会员服务
188+阅读 · 2021年11月12日
【2020新书】数据科学与机器学习导论,220页pdf
专知会员服务
80+阅读 · 2020年9月14日
【2020新书】高级Python编程,620页pdf
专知会员服务
235+阅读 · 2020年7月31日
【Manning新书】MLOps工程规模化,344页pdf
专知
22+阅读 · 2022年5月4日
【Manning新书】高级算法与数据结构,769页pdf
七本书籍带你打下机器学习和数据科学的数学基础
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
On the Wasserstein median of probability measures
Arxiv
0+阅读 · 2022年9月9日
Arxiv
28+阅读 · 2021年9月18日
Arxiv
110+阅读 · 2020年2月5日
Arxiv
13+阅读 · 2019年11月14日
Position-aware Graph Neural Networks
Arxiv
15+阅读 · 2019年6月11日
Arxiv
53+阅读 · 2018年12月11日
VIP会员
相关VIP内容
【2022新书】机器学习的实用模拟与合成,428页pdf
专知会员服务
98+阅读 · 2022年8月10日
【2022新书】机器学习与数据科学:基础与应用,272页pdf
专知会员服务
108+阅读 · 2022年8月3日
【Manning新书】MLOps工程规模化,344页pdf
专知会员服务
79+阅读 · 2022年5月4日
【干货书】数据科学家统计学基础:R和Python实战,486页pdf
【2021新书】面向对象的Python编程,418页pdf
专知会员服务
70+阅读 · 2021年12月15日
【Manning新书】高级算法与数据结构,769页pdf
专知会员服务
188+阅读 · 2021年11月12日
【2020新书】数据科学与机器学习导论,220页pdf
专知会员服务
80+阅读 · 2020年9月14日
【2020新书】高级Python编程,620页pdf
专知会员服务
235+阅读 · 2020年7月31日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员