这篇经过彻底修改的指南演示了命令行的灵活性如何帮助您成为更高效和高效的数据科学家。您将学习如何组合小型但功能强大的命令行工具来快速获取、清理、探索和建模您的数据。首先,作者Jeroen Janssens提供了一个Docker映像,其中包含超过100个Unix强大工具——无论您是在Windows、macOS还是Linux上工作都很有用。
您将很快发现为什么命令行是一种敏捷的、可伸缩的和可扩展的技术。即使您习惯于使用Python或R处理数据,您也将了解如何通过利用命令行的强大功能来极大地改进数据科学工作流。本书是数据科学家、分析师、工程师、系统管理员和研究人员的理想读物。