【科普】吴飞教授：《走进人工智能》---第7讲从最优解到均衡解：博弈论拥抱人工智能∣纳什均衡：洞悉“看不见的手”

2022 年 4 月 1 日 中国图象图形学学会CSIG

由高等教育出版社、高等教育电子音像出版社出品，浙江大学上海高等研究院联合上海人工智能实验室智能教育中心共同打造了原创人工智能前沿科普有声通识数字栏目——《走进人工智能》，主理人为浙江大学上海高等研究院常务副院长，浙江大学人工智能研究所所长、中国图象图形学学会理事、动画与数字娱乐专业委员会副主任 吴飞教授 ，本栏目已在喜马拉雅平台正式上线。

本期内容为《走进人工智能》：第7讲从最优解到均衡解：博弈论拥抱人工智能∣纳什均衡：洞悉“看不见的手”

《走进人工智能》

第7讲

从最优解到均衡解：博弈论拥抱人工智能

你好，这里是吴飞的数字专栏《走进人工智能》。上一讲中我们介绍了“从华丽转身到炼金术之困：深度学习”。在专栏的第七讲，我为你准备的内容是“从最优解到均衡解：博弈论拥抱人工智能”。一般来说，人工智能是从数据出发，学习数据中所蕴含的模式，构建一个最佳模型，完成特定任务。但是在解决商品竞拍和资源分配等现实问题时，我们的目标往往不是最优解，而是均衡解，也就是给出让参与各方都能接受的解决之道，这就需要将博弈论与人工智能进行碰撞融合。这一讲中我将介绍纳什均衡这一博弈模型，以及博弈智能在围棋、德州扑克和星际争霸等领域的体现。

纳什均衡：洞悉“看不见的手”

“博弈”这一概念自古有之，古汉语中的“博弈”二字最初是指六博和围棋两种游戏。《论语•阳货》中有言：“子曰：饱食终日，无所用心，难矣哉！不有博弈者乎？为之，犹贤乎已。”这句话与“仓廪实而知礼节”有异曲同工之妙，即温饱之后可以参加围棋等高雅活动。《史记•孙子吴起列传》中记载的田忌赛马故事就是中国古代博弈思想的体现。

博弈论主要研究的内容是博弈行为中最优对抗策略及博弈稳定局势。在博弈对决中，带有相互竞争意图的若干主体，为了达到各自的目标和利益，采取带有对抗性的行为进行斗争。博弈论研究的目的是为博弈参与者谋取最大利益，也就是让博弈参与者“两害相权取其轻，两利相权取其重”，《墨子•大取》中 “利之中取大、害之中取小”也表达了相似的思想。

现代博弈论思想起源于冯·诺伊曼（John von Neumann）与奥斯卡·摩根斯特恩（Oskar Morgenstern）于1944年合作出版的《博弈论与经济行为》这一本书。该书以数学形式阐述了博弈论及其思想。

约翰·纳什（John Forbes Nash Jr.）是将博弈论发扬光大的先驱者。1950年，他在完成的27页博士论文中提出了“非合作博弈（non-cooperative games）”这一思想，证明了博弈主体参与竞争的过程中存在均衡解，这一均衡解就被称为纳什均衡（Nash equilibrium）。

为了进一步解释纳什均衡，我们先来看看亚当斯密(Adam Smith)在1776年出版的《国富论》一书中的论断。他认为市场机制是“一只看不见的手”，价格在市场中作为一种信息引导着资源配置，最终达到有效率的均衡配置。这一理论强调，每个人在市场中都追求自身利益最大化，最终导致集体利益最大化。纳什却否定了这一观点，他提出的纳什均衡认为每个人在市场中按照自身利益最大化去决策，达到的结果并不一定意味着集体利益最大化。纳什本人因提出了纳什均衡对“看不见的手”的洞悉，成为经济学应用中核心的理论，于1994年获得了诺贝尔经济学奖。

值得提及的是，2012年，加州大学洛杉矶分校数学及经济学名誉退休教授罗伊德.沙普利（Lloyd S. Shapley）为了解决大学录取和婚姻求偶等合作场景中相互匹配的问题，提出了稳定配对（stable matching）模型，获得了当年诺贝尔经济学奖，这是博弈论与经济学相结合并再次获奖。

产品名称：走进人工智能∣有声通识十五讲

主理人：吴飞

出品机构：高等教育出版社、高等教育电子音像出版社

合作机构：浙江大学上海高等研究院、上海人工智能实验室智能教育中心

出品时间：2022年1月

中国图象图形学学会高校志愿者招募

中国图象图形学学会关于征集2022重大科学问题、工程技术难题和产业技术问题的通知

中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多

相关内容

博弈论

关注 383

博弈论（Game theory）有时也称为对策论，或者赛局理论，应用数学的一个分支，目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构（游戏或者博弈）间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。