对于许多研究人员来说,Python是一个一流的工具,主要是因为它用于存储、操作和洞察数据的库。这个数据科学技术栈的各个部分有很多资源,但只有通过Python数据科学手册,你才能获得所有的资源——ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关工具。
https://www.oreilly.com/library/view/python-data-science/9781491912126/
熟悉阅读和编写Python代码的工作科学家和数据处理人员会发现这个全面的桌面参考资料非常适合处理日常问题:操作、转换和清理数据;可视化不同类型的数据;并使用数据建立统计或机器学习模型。很简单,这是Python科学计算的必备参考资料。 通过这本手册,你将学习如何使用: * IPython和Jupyter:为使用Python的数据科学家提供计算环境 * NumPy:包括ndarray,用于在Python中高效存储和操作密集数据数组 * Pandas:以DataFrame为特色,用于在Python中高效存储和操作标记/列式数据 * Matplotlib:包含Python中灵活的数据可视化功能 * Scikit-Learn:为最重要和已建立的机器学习算法提供高效和干净的Python实现