理解并实施panda的大数据分析解决方案,强调性能。本书通过探索其底层实现和数据结构,增强了您使用Python数据分析库pandas的直觉。
《Pandas 编程思想》介绍了大数据的主题,并通过观看pandas帮助解决的激动人心和有影响力的项目来展示概念。从那里,您将学习按大小和类型评估您自己的项目,以确定pandas是否适合您的需要。作者Hannah Stepanek解释了如何在pandas中有效地加载和规范化数据,并回顾了一些最常用的加载器和它们的几个最强大的选项。然后,您将了解如何有效地访问和转换数据,应该避免哪些方法,以及何时使用更高级的性能技术。您还将学习基本的数据访问、学习panda和直观的字典语法。此外,还讨论了如何选择正确的DataFrame格式、使用多层次的DataFrame以及将来如何改进panda。
在本书结束时,您将对pandas库的底层工作原理有一个牢固的理解。准备好用正确的方法在你自己的项目中做出自信的决定。
你将学到什么
理解pandas的底层数据结构,以及为什么在某些情况下它会这样执行
了解如何使用pandas正确地提取、转换和加载数据,重点关注性能
选择正确的数据格式,使数据分析简单有效。
使用其他Python库提高pandas操作的性能
这本书是给谁的
具有基本Python编程技能的软件工程师热衷于在大数据分析项目中使用pandas。Python软件开发人员对大数据感兴趣。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“P190” 可以获取《Pandas编程思想,190页pdf阐述正确使用Python数据分析库》专知下载链接索引