【2022新书】高效数据科学基础: 如何使数据科学家高效，353页pdf - 专知VIP

会员服务 ·

41

数据科学 · Manning（出版社） · 书籍 ·

2022 年 7 月 17 日

【2022新书】高效数据科学基础: 如何使数据科学家高效，353页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

简化数据科学基础设施，为数据科学家提供从原型到生产的有效路径。《高效数据科学基础》是为数据科学和机器学习应用程序组装基础设施的实践指南。它揭示了Netflix和其他数据驱动公司管理尖端数据基础设施的过程。

当您使用这个易于遵循的指南时，您将从头开始设置端到端基础设施，使用一个完全可定制的流程，您可以很容易地适应您的公司。您将了解如何使用现有的云基础设施、一堆开源软件和惯用的Python提高数据科学家的工作效率。在整个过程中，您将遵循以人为中心的方法，重点关注用户体验和满足数据科学家的独特需求。

第一章: 介绍第二章: 数据科学的工具链第三章: 介绍Metaflow 第四章: 计算层的扩展第五章: 实践可扩展和性能第六章: 进入生产阶段第七章: 处理数据第八章: 使用和运作模式第九章: 使用完整堆栈的机器学习

机器学习和数据科学应用是人类构建的最复杂的工程产品，如果你考虑到驱动它们的全部软件和硬件堆栈的话。因此，在今天，在21世纪20年代初，构建这样的应用并不容易，这就不足为奇了。机器学习和数据科学将继续存在。由高级数据驱动技术驱动的应用程序在各个行业中越来越普遍。因此，显然需要使构建和操作这样的应用程序成为一个更轻松、更有纪律的过程。引用阿尔弗雷德·怀特黑德的话:“文明的进步是通过扩展我们无需思考就能执行的重要操作的数量。”这本书教你如何构建一个有效的数据科学基础设施，它允许用户试验创新的应用，将它们部署到生产中，并不断改进它们，而不需要过多考虑技术细节。没有一种千篇一律的方法可以适用于所有的用例。因此，本书关注的是通用的、基本的原则和组件，这些原则和组件可以在您的环境中以一种有意义的方式实现。

https://www.manning.com/books/effective-data-science-infrastructure#:~:text=Effective%20Data%20Science%20Infrastructure%3A%20How,their%20cutting%20edge%20data%20infrastructure.

成为VIP会员查看完整内容

76

相关内容

数据科学

数据科学（英語：data science）是一门利用数据学习知识的学科，其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术，包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

【2022新书】机器学习的实用模拟与合成，428页pdf

【2022新书】机器学习的实用模拟与合成，428页pdf

专知会员服务

99+阅读 · 2022年8月10日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知会员服务

110+阅读 · 2022年8月3日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知会员服务

61+阅读 · 2022年7月16日

【Manning新书】MLOps工程规模化，344页pdf

【Manning新书】MLOps工程规模化，344页pdf

专知会员服务

84+阅读 · 2022年5月4日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知会员服务

168+阅读 · 2022年1月29日

【2021新书】面向对象的Python编程，418页pdf

【2021新书】面向对象的Python编程，418页pdf

专知会员服务

71+阅读 · 2021年12月15日

【Manning新书】高级算法与数据结构，769页pdf

【Manning新书】高级算法与数据结构，769页pdf

专知会员服务

193+阅读 · 2021年11月12日

【2020新书】数据科学与机器学习导论，220页pdf

【2020新书】数据科学与机器学习导论，220页pdf

专知会员服务

81+阅读 · 2020年9月14日

【2020新书】高级Python编程，620页pdf

【2020新书】高级Python编程，620页pdf

专知会员服务

240+阅读 · 2020年7月31日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

144+阅读 · 2019年12月1日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知

25+阅读 · 2022年8月3日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知

4+阅读 · 2022年7月16日

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

专知

20+阅读 · 2022年5月28日

【Manning新书】MLOps工程规模化，344页pdf

【Manning新书】MLOps工程规模化，344页pdf

专知

24+阅读 · 2022年5月4日

【Manning新书】如何领导数据科学？How to Lead in Data Science

【Manning新书】如何领导数据科学？How to Lead in Data Science

专知

5+阅读 · 2022年3月27日

【Manning新书】高级算法与数据结构，769页pdf

【Manning新书】高级算法与数据结构，769页pdf

专知

45+阅读 · 2021年11月12日

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

图与推荐

14+阅读 · 2021年10月22日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

七本书籍带你打下机器学习和数据科学的数学基础

七本书籍带你打下机器学习和数据科学的数学基础

云栖社区

26+阅读 · 2018年4月22日

【下载】Scikit-learn作者新书《Python机器学习导论》, 教程+代码手把手带你实践机器学习算法

【下载】Scikit-learn作者新书《Python机器学习导论》, 教程+代码手把手带你实践机器学习算法

专知

72+阅读 · 2017年12月4日

大数据环境下稀有类数据挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于数据共享的高并发图计算系统及核心技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

藻毒素降解酶MlrA活性中心及其催化降解藻毒素分子机理的研究

国家自然科学基金

0+阅读 · 2014年12月31日

（半）代数系统的几何结构分析的高效算法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

结构型优化及其在数据分析中的应用

国家自然科学基金

2+阅读 · 2012年12月31日

特种石墨制备过程中原料加压湿法高效脱杂机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

离子液体捕集分离CO2的关键科学问题研究

国家自然科学基金

0+阅读 · 2009年12月31日

硅微陀螺阵列技术及其信号处理方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

层析γ25195;描关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

高效有机染料的合成及其染料敏化太阳能电池的研究

国家自然科学基金

0+阅读 · 2009年12月31日

On the Wasserstein median of probability measures

On the Wasserstein median of probability measures

Arxiv

0+阅读 · 2022年9月9日

FAT Forensics: A Python Toolbox for Implementing and Deploying Fairness, Accountability and Transparency Algorithms in Predictive Systems

Arxiv

0+阅读 · 2022年9月8日

Interpretations Steered Network Pruning via Amortized Inferred Saliency Maps

Arxiv

0+阅读 · 2022年9月7日

AI Accelerator Survey and Trends

Arxiv

28+阅读 · 2021年9月18日

Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better

Arxiv

28+阅读 · 2021年6月16日

Graph-Based Deep Learning for Medical Diagnosis and Analysis: Past, Present and Future

Graph-Based Deep Learning for Medical Diagnosis and Analysis: Past, Present and Future

Arxiv

36+阅读 · 2021年5月27日

A Survey on Causal Inference

Arxiv

112+阅读 · 2020年2月5日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Position-aware Graph Neural Networks

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

VIP会员

相关主题

Manning（出版社）

相关VIP内容

【2022新书】机器学习的实用模拟与合成，428页pdf

【2022新书】机器学习的实用模拟与合成，428页pdf

专知会员服务

99+阅读 · 2022年8月10日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知会员服务

110+阅读 · 2022年8月3日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知会员服务

61+阅读 · 2022年7月16日

【Manning新书】MLOps工程规模化，344页pdf

【Manning新书】MLOps工程规模化，344页pdf

专知会员服务

84+阅读 · 2022年5月4日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知会员服务

168+阅读 · 2022年1月29日

【2021新书】面向对象的Python编程，418页pdf

【2021新书】面向对象的Python编程，418页pdf

专知会员服务

71+阅读 · 2021年12月15日

【Manning新书】高级算法与数据结构，769页pdf

【Manning新书】高级算法与数据结构，769页pdf

专知会员服务

193+阅读 · 2021年11月12日

【2020新书】数据科学与机器学习导论，220页pdf

【2020新书】数据科学与机器学习导论，220页pdf

专知会员服务

81+阅读 · 2020年9月14日

【2020新书】高级Python编程，620页pdf

【2020新书】高级Python编程，620页pdf

专知会员服务

240+阅读 · 2020年7月31日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

144+阅读 · 2019年12月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知

25+阅读 · 2022年8月3日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知

4+阅读 · 2022年7月16日

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

【实用书】数据科学和机器学习:数学和统计方法，533页pdf，Python手把手带你掌握机器学习

专知

20+阅读 · 2022年5月28日

【Manning新书】MLOps工程规模化，344页pdf

【Manning新书】MLOps工程规模化，344页pdf

专知

24+阅读 · 2022年5月4日

【Manning新书】如何领导数据科学？How to Lead in Data Science

【Manning新书】如何领导数据科学？How to Lead in Data Science

专知

5+阅读 · 2022年3月27日

【Manning新书】高级算法与数据结构，769页pdf

【Manning新书】高级算法与数据结构，769页pdf

专知

45+阅读 · 2021年11月12日

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

21新书《图机器学习GPML》493页pdf阐述图机器学习工业实战技术

图与推荐

14+阅读 · 2021年10月22日

【干货书】Python机器学习导论，340页pdf数据科学家指南

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知

97+阅读 · 2020年6月4日

七本书籍带你打下机器学习和数据科学的数学基础

七本书籍带你打下机器学习和数据科学的数学基础

云栖社区

26+阅读 · 2018年4月22日

【下载】Scikit-learn作者新书《Python机器学习导论》, 教程+代码手把手带你实践机器学习算法

【下载】Scikit-learn作者新书《Python机器学习导论》, 教程+代码手把手带你实践机器学习算法

专知

72+阅读 · 2017年12月4日

相关基金

大数据环境下稀有类数据挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于数据共享的高并发图计算系统及核心技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

藻毒素降解酶MlrA活性中心及其催化降解藻毒素分子机理的研究

国家自然科学基金

0+阅读 · 2014年12月31日

（半）代数系统的几何结构分析的高效算法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

结构型优化及其在数据分析中的应用

国家自然科学基金

2+阅读 · 2012年12月31日

特种石墨制备过程中原料加压湿法高效脱杂机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

离子液体捕集分离CO2的关键科学问题研究

国家自然科学基金

0+阅读 · 2009年12月31日

硅微陀螺阵列技术及其信号处理方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

层析γ25195;描关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

高效有机染料的合成及其染料敏化太阳能电池的研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

On the Wasserstein median of probability measures

On the Wasserstein median of probability measures

Arxiv

0+阅读 · 2022年9月9日

FAT Forensics: A Python Toolbox for Implementing and Deploying Fairness, Accountability and Transparency Algorithms in Predictive Systems

Arxiv

0+阅读 · 2022年9月8日

Interpretations Steered Network Pruning via Amortized Inferred Saliency Maps

Arxiv

0+阅读 · 2022年9月7日

AI Accelerator Survey and Trends

Arxiv

28+阅读 · 2021年9月18日

Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better

Arxiv

28+阅读 · 2021年6月16日

Graph-Based Deep Learning for Medical Diagnosis and Analysis: Past, Present and Future

Graph-Based Deep Learning for Medical Diagnosis and Analysis: Past, Present and Future

Arxiv

36+阅读 · 2021年5月27日

A Survey on Causal Inference

Arxiv

112+阅读 · 2020年2月5日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Position-aware Graph Neural Networks

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

Deep Learning on Graphs: A Survey

Arxiv

53+阅读 · 2018年12月11日

微信扫码咨询专知VIP会员