AlphaZero、Leela Chess Zero和Stockfish NNUE彻底改变了计算机象棋。这本书对这种发动机的内部技术工作作了全面的介绍。
这本书分为四个章节:
第一章介绍了神经网络,涵盖了所有用于构建深度网络(如AlphaZero所使用的)的基本构建模块。内容包括感知器、反向传播和梯度下降、分类、回归、多层perpectron、矢量化技术、卷积网络、挤压和激励网络、全连接网络、批量归一化和修正线性单元、残差层、过拟合和欠拟合。
第二章介绍了国际象棋引擎以及AlphaZero所使用的经典搜索技术。内容包括极大极小值、alpha-beta搜索和蒙特卡罗树搜索。
第三章介绍了现代象棋引擎的设计。除了开创性的AlphaGo, AlphaGo Zero和AlphaZero,我们还介绍了Leela Chess Zero, Fat Fritz, Fat Fritz 2和efficient Updateable Neural Networks (NNUE)以及Maia。
第四章是实现一个小型化的AlphaZero。AlphaZero,国际象棋的简化版本,就是一个例子。采用极大极小搜索法求解六爪,生成有监督学习的训练位置。然后作为比较,一个类似AlphaZero的训练循环是通过结合强化学习的自我游戏来完成的。最后,比较了AlphaZero类训练和监督式训练。