这本书包含了五个案例研究。每个案例研究都以详细的问题陈述开始,您需要解决这些问题。问题陈述后面有两到五个部分,介绍解决问题所需的数据科学技能。这些技能部分涵盖了基本的库,以及数学和算法技术。最后的每个案例研究部分描述了问题的解决方案。
通过本书学习到:
计算和绘制概率的技术
使用Scipy进行统计分析
如何用聚类算法组织数据集
如何可视化复杂的多变量数据集
如何训练决策树的机器学习算法
本书目录内容:
案例研究1属于基本概率论:
第1节讨论了如何使用简单的Python计算概率。
第2节介绍了概率分布的概念。它还介绍了Matplotlib可视化库,可以使用它来可视化发行版。
第3节讨论了如何使用随机模拟估计概率。引入NumPy数值计算库,以促进仿真的高效执行。
第4节包含了案例研究解决方案
案例研究2从概率扩展到统计学
案例研究3着重于地理数据的无监督聚类
案例研究4关注使用大规模数值计算的自然语言处理
案例研究5完成了关于网络理论和监督机器学习的讨论
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“D706” 就可以获取《【Maning新书】数据科学训练营,Data Science Bookcamp,706页pdf》专知下载链接