开放式解决问题的能力对数据科学职业至关重要。不幸的是,这些能力不能仅仅通过阅读获得。要成为一个解决问题的人,你必须坚持不懈地解决困难的问题。考虑到这一点,我围绕案例研究编写了我的书:模拟真实世界的开放式问题。案例研究范围从在线广告分析到利用新闻数据跟踪疾病爆发。完成这些案例研究后,您将非常适合开始数据科学的职业生涯。
https://www.manning.com/books/data-science-bookcamp
这本书包含了五个案例研究。每个案例研究都以详细的问题陈述开始,您需要解决这些问题。问题陈述后面有两到五个部分,介绍解决问题所需的数据科学技能。这些技能部分涵盖了基本的库,以及数学和算法技术。最后的每个案例研究部分描述了问题的解决方案。
通过本书学习到: 计算和绘制概率的技术 使用Scipy进行统计分析 如何用聚类算法组织数据集 如何可视化复杂的多变量数据集 如何训练决策树的机器学习算法
本书目录内容: 案例研究1属于基本概率论: 案例研究2从概率扩展到统计学 案例研究3着重于地理数据的无监督聚类 案例研究4关注使用大规模数值计算的自然语言处理 案例研究5完成了关于网络理论和监督机器学习的讨论