【Manning2022新书】Python与PySpark的数据分析,458页pdf

2022 年 3 月 21 日 专知


要重视你的数据!PySpark为Python生态系统带来了强大的Spark大数据处理引擎,让您可以无缝地扩展数据任务,并创建闪电般快速的管道。


在Python和PySpark的数据分析中,你将学习如何:

  • 在数据跨多台机器扩展时管理数据

  • 满怀信心地扩展您的数据程序

  • 在各种源和格式之间读写数据

  • 使用PySpark的数据操作功能处理混乱的数据

  • 发现新的数据集并进行探索性数据分析

  • 构建自动化的数据管道,用于转换、总结和从数据中获得洞察力

  • 解决常见的PySpark错误

  • 创建可靠的长时间运行的作业


使用Python和PySpark进行数据分析是交付成功的Python驱动数据项目的指南。这本实用的书包含了相关的例子和基本的技术,教你如何为报告、机器学习和其他以数据为中心的任务构建管道。每一章中的快速练习可以帮助您实践所学的知识,并迅速开始在数据系统中实现PySpark。不需要之前的Spark知识。


使用Python和PySpark进行数据分析可以帮助您解决使用PySpark进行数据科学的日常挑战。您将了解如何在从任何源(Hadoop集群、云数据存储或本地数据文件)获取数据的同时,在多台机器上扩展处理能力。一旦您了解了这些基础知识,您将通过构建机器学习管道,并混合Python、pandas和PySpark代码来探索PySpark的全面通用性。


https://www.manning.com/books/data-analysis-with-python-and-pyspark



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“P458” 就可以获取【Manning2022新书】Python与PySpark的数据分析,458页pdf》专知下载链接

请扫码加入专知人工智能群(长按二维码),或者加专知小助手微信(zhuanzhi02),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG、论文等)交流~

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取70000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取70000+AI主题知识资源
登录查看更多
17

相关内容

【干货书】利用 Python 进行数据分析,470页pdf
专知会员服务
109+阅读 · 2021年3月13日
【2020新书】实战R语言4,323页pdf
专知会员服务
98+阅读 · 2020年7月1日
专知会员服务
165+阅读 · 2020年6月4日
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【Manning新书】高级算法与数据结构,769页pdf
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月7日
Arxiv
20+阅读 · 2021年12月19日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员