这本关于机器学习的研究生教科书讲述了数据模式如何支持预测和结果行动的故事。从决策的基础开始,我们将涵盖作为有监督学习的组成部分的表示、优化和泛化。关于数据集作为基准检查他们的历史和科学基础的一章。对因果关系的介绍,因果推理的实践,序列决策,和强化学习使读者了解概念和工具来。整本书讨论了历史背景和社会影响。读者有概率论、微积分和线性代数方面的经验就足够了。
https://mlstory.org/
目录内容:
导论 Introduction
决策 Decision making
监督学习 Supervised learning
表示学习 Representations and features
优化 Optimization
泛化 Generalization
深度学习 Deep learning
数据 Datasets
因果性 Causality
因果性实践 Causal inference in practice
序列决策与动态优化,Sequential decision making and dynamic programming
强化学习,Reinforcement learning
Epilogue
Mathematical background
就其概念而言,我们的书既是对新事物的旧看法,也是对旧事物的新看法。从一个角度来看,我们回到了模式分类的根源。我们认为,今天的机器学习实践与20世纪60年代的模式分类惊人地相似,只是最近几十年出现了一些显著的创新。
这并不是低估最近的进展。像许多人一样,我们对近年来发生的进步感到惊讶。图像识别技术得到了极大的改进。即使是很小的设备现在也能可靠地识别语音。自然语言处理和机器翻译已经取得了巨大的飞跃。机器学习甚至在一些困难的科学问题上也有帮助,比如蛋白质折叠。
然而,我们认为不承认模式分类是这些改进背后的驱动力是错误的。迄今为止,机器学习的许多进步背后的独创性并不在于从根本上背离模式分类,而是在于找到新的方法,使问题能够适应模式分类的模型拟合技术。
因此,本书的前几章与杜达(Duda)和哈特(Hart)的优秀文本《模式分类与场景分析》(Pattern Classification and Scene Analysis)比较接近,特别是1973年第一版的《模式分类与场景分析》(Pattern Classification and Scene Analysis),至今仍然适用。的确,杜达和哈特在1973年总结了模式分类的现状,它与我们今天所认为的机器学习的核心惊人地相似。我们增加了表示、优化和泛化方面的新进展,所有这些仍是不断发展、积极研究的主题。
首先,本书强调了数据集在机器学习中的作用。全文探索机器学习基准的历史、意义和科学基础。除此之外,这本书还包括了因果关系的现代介绍,以及因果推理的实践,这些都是该领域中过时的争议。第三,我们的书彻底地涵盖了顺序和动态模型。最后,我们试图在几个不同的地方强调机器学习的潜在危害、局限性和社会后果。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“ML296” 可以获取《【2021新书】模式、预测与行动:机器学习的故事,296页pdf》专知下载链接索引