本书侧重于基于python的工具和技术,以帮助您在典型数据科学栈的所有方面(如统计分析、可视化、模型选择和特性工程)变得高效。

您将回顾日常业务流程中潜伏的低效率和瓶颈,并使用实际的解决方案来解决它们。重复数据科学任务的自动化是贯穿全书的一个关键思维模式。您将学习如何在Python生态系统中已经存在的高级库和包的帮助下扩展现有的编码实践,以高效地处理更大的数据集。

这本书关注的主题包括如何测量机器学习模型的内存占用和执行速度,数据科学管道的质量测试,以及为应用程序开发模块化数据科学管道。您将回顾Python库,这些库在自动化和加速日常任务方面非常有用。

最后,您将理解并执行传统方法之外的数据科学和机器学习任务,并利用Python数据科学生态系统的全部范围来提高生产率。

你将学习

  • 为数据科学和机器学习编写快速高效的代码
  • 构建文件且富有表现力的数据科学处理流程
  • 测量机器学习方法的内存和CPU配置文件
  • 充分利用GPU在数据科学任务中的潜力
  • 高效地处理大而复杂的数据集

成为VIP会员查看完整内容
61

相关内容

Python是一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言。
【2021新书】Python流数据实用机器学习,127页pdf
专知会员服务
75+阅读 · 2021年5月23日
【2020新书】高级Python编程,620页pdf
专知会员服务
240+阅读 · 2020年7月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
已删除
Arxiv
33+阅读 · 2020年3月23日
Arxiv
15+阅读 · 2020年2月5日
VIP会员
相关VIP内容
【2021新书】Python流数据实用机器学习,127页pdf
专知会员服务
75+阅读 · 2021年5月23日
【2020新书】高级Python编程,620页pdf
专知会员服务
240+阅读 · 2020年7月31日
相关基金
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
已删除
Arxiv
33+阅读 · 2020年3月23日
Arxiv
15+阅读 · 2020年2月5日
微信扫码咨询专知VIP会员