无论是基于学术理论还是人类和机器的经验发现,所有的金融模型都受到建模误差的影响,这些误差可以减轻但无法消除。概率机器学习技术基于对概率的简单直观定义以及概率理论的严格演算。
与传统的人工智能系统不同,概率机器学习(ML)系统将错误和不确定性视为特征,而不是缺陷。它们将由于不精确的模型输入和输出产生的不确定性量化为概率分布,而不是点估计。最重要的是,这些系统能够在它们的推断和预测在当前市场环境中不再有用时提前警告我们。在不确定性和信息不完整的情况下,这些ML系统为金融决策和风险管理提供了现实支持。
概率机器学习是下一代用于AI驱动的金融和投资系统的ML框架和技术,原因有很多。它们是生成性集合,可以持续地从小而嘈杂的金融数据集中学习,同时无缝地实现概率推断、预测和反事实推理。通过摆脱有缺陷的统计方法(以及狭隘的传统概率观念,将概率视为极限频率),您可以拥抱将概率视为公理统计框架内的逻辑的直观观点,这种观点全面而成功地量化了不确定性。本书向您展示了为什么以及如何进行这种过渡。 本书的内容可以分为两个逻辑部分,不均匀地交织在每一章中。其中一部分考察了现行经济学、统计学和机器学习模型在金融和投资领域的令人震惊的无用性。另一部分考察了为什么概率机器学习是这些问题领域中一个不太错误、更有用的模型。本入门指南的独特焦点在于理解这个复杂的多学科领域的基础。只涵盖了关键的概念和应用。有时候确实是少即是多。本书的组织结构如下,每一章至少涵盖了金融和投资领域的一个主要概念,并在一个实际的Python代码练习中加以应用:
第1章,“需要概率机器学习”,考察了理论金融学的一些严重不足之处,解释了所有金融模型都受到三重错误的困扰,并且为什么我们需要一种系统的方法来量化我们推断和预测的不确定性。该章节解释了为什么概率机器学习为金融和投资提供了一个有用的框架。第2章,“分析和量化不确定性”,通过蒙提霍尔问题回顾了概率理论的基本规则,考察了概率的含义,并探讨了贯穿我们世界的三重不确定性。该章还探讨了归纳问题及其算法重述、无免费午餐(NFL)定理,以及它们如何支撑金融、投资和概率机器学习。第3章,“用蒙特卡洛模拟量化输出不确定性”,回顾了重要的统计概念,解释了为什么蒙特卡洛模拟(MCS)作为最重要的数值技术之一,通过生成近似概率解来处理分析难题。第4章,“传统统计方法的危险性”,揭示了在研究和工业中常用的传统统计推断方法的欺诈行为,并解释了为什么它们是困扰社会和经济科学的虚假研究结果的主要原因。第5章,“概率机器学习框架”,探讨了概率机器框架,并演示了如何在这种生成模型中逻辑而无缝地集成来自数据的推断和模拟新数据。第6章,“传统AI系统的危险性”,揭示了传统AI系统的危险性,特别是它们缺乏基本的常识,以及它们对自身局限性的无知,这对所有利益相关者和整个社会都构成了巨大风险。马尔可夫链蒙特卡洛模拟被介绍为一种用于解决金融和投资领域复杂问题的依赖抽样方法。第7章,“用生成集成进行概率机器学习”,解释了概率机器学习本质上是一种集成机器学习形式。它向读者展示了如何使用PyMC、Xarray和ArviZ Python库在金融和投资领域的回归问题中开发生成线性集成的原型。第8章,“用生成集成做概率决策”,展示了如何将生成集成应用于金融和投资中的风险管理和资本配置决策。探讨了遍历性的含义以及在金融决策中使用集成平均值的陷阱。还考察了资本分配算法(包括凯利准则)的优势和劣势。