AI「赌王」问世！桥牌胜率83%，吊打8位人类冠军，但不会叫牌

会员服务 ·

AI「赌王」问世！桥牌胜率83%，吊打8位人类冠军，但不会叫牌

2022 年 3 月 30 日 新智元

新智元报道

编辑：袁榭

【新智元导读】2022年3月25日，法国初创公司NukkAI举办的桥牌挑战赛中，其桥牌AI获胜的次数多过人类选手，把人类比下去了。

AI下棋能把人类顶尖选手下到哭、玩星际争霸能赢世界冠军。

现在，连人类智力游戏最后的高地-桥牌，AI也能占领了么？这……倒真不一定。

桥牌AI胜率83%，超过人类冠军

据英国《卫报》报道，AI近日在桥牌比赛中击败了八位世界冠军。直到当时，在这种游戏中，人类一直保持着至高无上的赢家地位，机器的挑战总被击败。

这场胜利代表了AI业的一个新里程碑，因为在玩桥牌时，玩家得依靠不完整的信息做出决策，并且必须对其他多名玩家的行为做出反应。这种状况更接近于人类的决策环境。

相比之下，人工智能击败人类冠军的国际象棋和围棋，玩家每次比赛只有单个对手，并且两者都拥有盘面上的全部信息。

伦敦帝国理工学院机器学习教授Stephen Muggleton因此称：「我们当下所见，代表了AI系统状态的根本性重要进步。」

2022年3月25日，法国初创公司NukkAI在巴黎举行的为期两天的挑战赛结束时宣布了其AI获胜的消息。

NukkAI举办的挑战赛中，要求人类冠军连玩800张牌，分为每次发牌10张的80次竞赛对决。

这种赛制去除了桥牌游戏本有的初始叫牌部分。

每个人类冠军都用自己和他们的虚拟「明手」搭档的牌对抗一对桥牌机器人程序。

这些打牌bot是迄今为止世界上最强的牌类bot，打遍机器人界无敌手，但对决人类顶尖选手时还是输多赢少。

NukkAI开发的桥牌AI叫做NooK，在赛制中被安排在和人类冠军一模一样的角色位置，对手bot、牌面牌色完全相同。

最后比较AI和人类冠军谁赢的平均次数更多，谁就是最后的胜出者。

最后NooK赢得了80次中的67次，以83%的优胜率赛过人类冠军，成为最后赢家。

NukkAI的联合创始人Jean-Baptiste Fantun表示，他一直相信该公司已经开发了5年的AI能在发牌数好几千的此类赛制中获胜，但这次的发牌数只有800。

宣布结果时，2010年菲尔兹奖得主、数学家Cédric Villani称NukkAI是「一个极好的法国创业成功故事」。

决策可被解释的「白盒」AI

NukkAI的另一位联合创始人、人工智能研究员Véronique Ventos称 NooK 为「新一代人工智能」，因为它的决策可被解释。

她说：「在桥牌中，如果你无法解释自己的决策，就很难真正玩下去」。因为完全的桥牌赛程必须依赖于合作伙伴之间的沟通。

可解释性是AI领域的热门话题。Muggleton表示：「近年来，公众所听到的关于机器学习的大部分成就，都是基于AlphaGo等黑盒系统，它无法向人类解释自己如何做出决策。」

相反，NooK代表了一种「白盒」或「神经符号」方法。它不是通过玩数十亿次游戏试错来习得玩法，而是首先学习游戏规则，然后再通过练习改进技能。 NooK是基于规则和深度学习系统的混合体，这种学习方式更近于人类。

美国罗德岛布朗大学计算机科学教授Michael Littman说：「业界的钟摆正朝着这些方式的方向摆动。无法解释事件何以发生的智能体，在以后的社会中是行不通的。」

Littman说，即使一个人或AI无法用语言表述他们在做什么，他们的行为也需要让其他智能体「清晰易懂」、行事准则得是共通且可理解的。

这在医疗和工程等领域至关重要。例如，未来自动驾驶汽车们在通过路口或变线抢道时，需要能够读取彼此的行为。

英国多次世界桥牌冠军、NooK的本次挑战者之一Nevena Senior称NooK的发明者们完成了一项「了不起的」工作。她发现这款AI比人类更能读懂对手，更能利用他们的错误。「这是人类在获得足够经验后才会做的事情，我很惊喜地发现AI模仿了典型的人类技能。」

赢了，但没完全赢：桥牌AI竟然不会叫牌

Littman教授对本次桥牌挑战不包括叫牌感到失望，这是桥牌过程中的沟通和欺骗所在的最有趣部分。

但Nevena Senior表示，人类和NooK拿到的发牌牌色变数很大，以至于没有叫牌的打牌过程也同样丰富。

不过不止教授失望，广大网友也纷纷表示，没有叫牌，算什么AI在桥牌上战胜人类。

叫牌这个步骤，是桥牌中最具人类决策性质的，AI现在仍然无法复刻。光靠发牌的变量不能完全替代叫牌。

桥牌，全称合约桥牌，是两对双人搭档对峙的四人纸牌游戏。

双方需要在叫牌过程中互相竞争，确定「定约」。然后在打牌的时候，通过与队友的默契配合，获得「定约」目标的「墩数」，才算获胜。

对于AI来说，围棋与桥牌、或者说弈与博，在博弈计算中的根本区别，在于棋是完全信息动态博弈，而牌属于非完全信息动态博弈。

棋类竞赛中，对峙双方所掌握的局势信息是公开的、对称的，盘面一望即知、无遮无拦，AI只需要处理公开的完全局势数据。

而桥牌中，单个玩家开始时拿到的一手牌，得到的信息只是一副牌的四分之一，是不完整的。

在叫牌阶段，每个玩家需要在对手的干扰下与搭档交换自己的牌面信息、并干扰对手获得牌面信息。

通过叫牌，玩家能知道一部分同伴和对手的牌面信息，然后需要对不明情况进行猜测、判断和分析。

到了打牌阶段，作为牌搭子的两名玩家可以看到两家「明手」的牌面，也就是一副牌的二分之一，依然是不完整信息。

随着牌局的进行，隐藏手牌代表的未知信息越来越少，直到最后一轮牌打完，盘面才清晰。

所以桥牌的叫牌，是实行牌搭子间合作、对手间欺敌、体现和利用决策环境迷雾的关键步骤。

所以这次大家的反应才会如此：AI不会叫牌，算什么战胜人类呢。

不过，现实世界中大部分人类的互动都是同时存在合作与竞争，而且行为体都依据非公开、不完整的私有信息进行决策，同时不乏欺诈、伪饰、误导等干扰性操作。

如果AI真能在完整的桥牌游戏中胜过人类，那么真的代替人类进行决策、甚至成为「通用人工智能」（AGI），似乎也不再是梦想了。

参考资料：

https://www.theguardian.com/technology/2022/mar/29/artificial-intelligence-beats-eight-world-champions-at-bridge
https://www.springerprofessional.de/en/the-search-algorithm-for-the-game-of-bridge/19762716
https://www.youtube.com/watch?v=DHpeHCsojbI
https://twitter.com/nukkailab1