【作者简介】
【书籍简介】
PATTERNS, PREDICTIONS, AND ACTIONS——A story about machine learning(2021.10.26版本)
这是一本关于机器学习的研究生教材,讲述了数据模式如何支持预测和相应的行动。从决策的基础开始,我们将表示、优化和泛化作为监督学习的组成部分。数据集作为基准的一章考察了它们的历史和科学基础。对因果关系、因果推理实践、顺序决策和强化学习的自成一体的介绍为读者提供了推理行为及其后果的概念和工具。全文讨论了历史背景和社会影响。本书适合各种背景的读者——有概率论、微积分和线性代数的经验就足够了。
序言
从一种角度来看,我们将回到我们强调模式分类的根源。我们认为,今天的机器学习实践与20世纪60年代的模式分类惊人地相似,只是最近几十年出现了一些值得注意的创新。
这并不是低估了最近的进展。和许多人一样,我们对近年来发生的进步感到惊讶。图像识别有了显著的提高。即使是小型设备现在也能可靠地识别语音。自然语言处理和机器翻译已经取得了巨大的飞跃。机器学习甚至在一些困难的科学问题上也有帮助,比如蛋白质折叠。
然而,我们认为如果不认识到模式分类是这些改进背后的驱动力,那将是一个错误。到目前为止,机器学习的许多进步背后的独创性并不在于从根本上背离了模式分类,而是在于找到新的方法,使问题符合模式分类的模型拟合技术。
因此,本书的前几章相对紧密地遵循了Duda和Hart的优秀文本“模式分类和场景分析”,特别是1973年的第一版,至今仍然适用。事实上,Duda和Hart在1973年总结了模式分类的现状,它与我们今天所认为的机器学习的核心有着惊人的相似之处。我们在表述、优化和概括方面增加了新的发展,所有这些都是不断发展、积极研究的主题。
从不同的角度来看,我们的书在很多方面都与通常教授机器学习的方式不同。
首先,我们的文本强调了数据集在机器学习中的作用。一个完整的章节探讨了机器学习基准的历史、意义和科学基础。尽管数据集作为基准标准在今天是普遍存在的,但它是20世纪80年代相对较晚的发展。在机器学习的理论课程中,往往缺乏对数据集的详细考虑,数据的收集和构建,以及训练和测试范式。
第二,这本书包括一个现代的介绍因果关系和因果推理的实践,奠定了休息的争议在该领域。引言是自成一体的,从第一原则开始,不需要事先在智力上或意识形态上对因果关系领域作出承诺。我们对因果关系的处理包括概念基础,以及因果推理的一些实际工具,这些工具在众多应用中越来越多地应用。有趣的是,许多最近的因果估计器以巧妙的方式将因果推理问题减少到模式分类。因此,这个材料与本书的其余部分非常吻合。
第三,我们的书彻底地涵盖了序列和动态模型。尽管这些材料本身可以轻松地填满一个学期的课程,但我们希望提供在动态环境中思考决策所需的基本元素。特别是,鉴于最近对强化学习的兴趣如此之大,我们希望提供一个独立的简短介绍,以支持这一领域的概念。我们的方法遵循监督学习的方法:我们专注于在给定环境的概率模型时如何做出决定,然后转向在模型未知时如何采取行动。因此,我们首先关注最优顺序决策和动态规划。我们描述了这些问题的一些基本解决方法,并讨论了随着测量质量的恶化而出现的一些并发症。然后,当我们的模型未知时,我们转向决策,提供强盗优化和强化学习的调查。我们这里的重点是再次强调预测的力量。我们表明,对于大多数问题,模式识别可以被视为补充反馈控制,我们强调“确定性等价”决定making-where我们第一次使用数据来估计模型,然后使用反馈控制作为如果这个模型实在是最优或接近最优数量惊人的场景。
最后,我们试图在几个不同的地方强调机器学习的潜在危害、限制和社会后果。从第二次世界大战开始,机器学习就一直是政治性的。人工智能的进步为全球工业军事综合体提供了支持,并得到了资助。尽管机器学习在辅助设备等一些明确的积极应用方面很有用,但它也在跟踪、监视和战争中发挥了巨大的作用。在商业上,迄今为止最成功的用例是有针对性的广告和数字内容推荐,这两者对社会的价值都值得怀疑。一些学者解释了机器学习是如何通过给已经被边缘化、受压迫和处于不利地位的社区增加额外负担的方式,使不平等现象永恒化的。在刑事司法系统、医疗保健、教育和社会服务中,有关用统计模型取代人类判断的几场高风险辩论中,人工智能的叙述也影响了政策。
我们遗漏了一些值得注意的话题。有些人可能会发现,最明显的遗漏是缺乏关于无监督学习的材料。事实上,近年来在无监督学习方面已经有了大量的工作。值得庆幸的是,一些最成功的不带标签的学习方法可以被描述为模式识别的简化。例如,研究人员发现了从没有标签的数据点获取标签的巧妙方法,这种方法被称为自我监督。我们相信这本书的内容将为对这些主题感兴趣的学生做好准备。
我们所涵盖的材料支持一个学期的机器学习研究生介绍。我们邀请各种背景的读者。然而,数学的成熟度与概率,微积分,和线性代数是必需的。我们提供了一章关于数学背景的回顾。当然,这一章不能取代必修课程。
在写这本书时,我们的目标是平衡数学的严谨性和以最直接的方式呈现我们认为有用的见解。在当代学习理论中,重要的结果通常都有简短的概述,但要使这些论点严谨和精确,可能需要几十页的技术计算。这些证据对科学界的科学活动是至关重要的,但对于那些还不精通适当技术的人来说,往往会产生难以获得的重要见解。另一方面,许多机器学习课程完全放弃了证明,从而失去了它们包含的重要的基本思想。我们的目标是达到一种平衡,包括尽可能多的论据的全部细节,但经常让读者参阅相关文献以获得全部细节。