AlphaGo单挑五虎将获胜，连笑配对AlphaGo笑到最后

2017 年 5 月 26 日 机器之心

机器之心原创

作者：李泽南、杜夏德

经历过 AlphaGo与柯洁第一场势均力敌，第二场热血沸腾的比赛之后，今天，乌镇围棋峰会进入了配对赛与团体赛的争夺。上午 10:59 分，连笑八段联手 AlphaGo 执白战胜古力九段与 AlphaGo 的组合，赢得了史上首次人机配对赛。而在下午 16：:32 时，五位世界冠军组成的团队在与 AlphaGo 的对决中收官阶段认输，团体赛告于段落。

前所未有的人机赛制

今天 AlphaGo 与人类展开了两场比赛。在配对赛中，由「古力九段+AlphaGo」对战「连笑八段+AlphaGo」。比赛中，人类棋手除了要理解 AlphaGo 的风格，还要与之合作。每方有 1 小时的思考时间，人和 AlphaGo 交替落子，用时结束后只有 1 次 1 分钟的读秒。双人赛最早来自日本，该国的双人围棋协会独立于日本棋院，其宗旨就是推动双人赛。双人赛的好处是，对于棋手来说，输赢心理负担会减半。

在中午开始的团体赛中，五位来自中国的世界冠军级棋手组成团队，共同面对 AlphaGo。每方有两个半小时，用时结束后将有 3 次 1 分钟读秒。出战棋手为芈昱廷九段、时越九段、唐韦星九段、周睿羊九段、陈耀烨九段。五名风格截然不同的棋手和 AlphaGo 共同为我们献上了一局精彩的比赛。

本次人机对战中引入的相谈棋赛制对于 AlphaGo 来说也是前所未有的经历，所以格外引人注目。在以往人类棋手相谈赛中，其有利之处在于计算精确，每一步棋都是经过团队充分讨论决定出来的，因为个人很难看到局中的勺子，即围棋对局中出现明显漏招、误算。所以棋局质量很高；然而这种团队作战也会掩盖棋手的个人特色，也有棋手抱怨团队协作时存在沟通问题。日本棋手苏耀国曾在 2013 年首届世界围棋团体赛中表示，团队之沟通很难。不知道这一点是否给 AlphaGo 带来了更多优势。

配对赛：AlphaGo 要认输，遭古力拒绝后落子消极

早上 8:30 开始的配对赛同样采取中国规则，人和机器轮流落子。现年 23 岁的连笑八段执白，34 岁的古力九段执黑。黑棋上来还是点了三三。AlphaGo 走棋悬念连连，在这种情况下，人类棋手也连出奇招。相较于柯洁的比赛，人机配对赛中，双方下子很快，同时因为 AlphaGo 的加入，两方实力差距大幅缩小。

连笑执白在布局阶段率先发起攻势，但双方在右下角的缠斗却为黑棋造出了厚势。随后在右上角的争夺中，连笑选择脱先，70 手跳至天元试图形成大模样。由于处于落后形势，连笑的思考时间很长。行至 154 手，连笑与 AlphaGo 联手在棋盘左边下出险手，成功侵占了黑棋的大空。行至 200 手，全场占据优势的黑棋一方出现了分歧，AlphaGo 的代表举出了认输的牌子，但遭到了古力的拒绝，比赛继续（据古力介绍，AlphaGo 认输，人类有权拒绝，但如果人类选手认输，AlphaGo 则不能拒绝）。随后古力在很多步骤中陷入长考，双方均进入读秒阶段，古力在勉力支撑之后无力回天，在 220 手选择投子认负。

古力在赛后采访中表示，双方进入交战后，他与 AlphaGo 的意见开始出现明显分歧，自己出现失误，错过了一个大劫，导致局势逆转。因为这个大劫，己方的 AlphaGo 可能没有发挥出最高水平。古力自嘲自己把「胜率从 75% 下到了 45%。」

获胜方连笑在接受采访时称开局与 AlphaGo 配合有点困难，把队友带入了一条不归路，自己的队友不如对方的 AlphaGo 稳健，感觉很像人类。

团体赛：相谈棋五人联手未撼动 AlphaGo

从左至右：时越、芈昱廷、唐韦星、陈耀烨、周睿羊

中午 12：30 团体赛开始，猜先后，由周睿羊代表人类棋手一方执黑棋，黄士杰博士代表 AlphaGo 执白。布局阶段波澜不惊，人类方吸取了上午比赛的教训，选择了三三布局而非星位。比赛中，团队五人时常出现分歧，长考频出，耗时较快。行至 42 手棋时，AlphaGo 再次在右上角点三三，这一招目前已成为 AlphaGo 的招牌进攻方式，并已被职业棋手效仿应用。

行至 45 手棋时，白方为节省时间派出陈耀烨短暂上阵摆棋。随后周睿羊回归，AlphaGo 在 54 手时再次出现保守打法，行棋稳健，似乎胜算在握，意图显现。

行至 70 手，形势落后的人类团队决定在上边屠杀白棋大龙，但被白棋在 80 手大飞化解。随后两方在右上角展开劫争，双方消耗劫材。到 133 手，黑棋在右上角开劫，侵蚀了右上角白棋的领地。比赛逐渐进入收官阶段。至 186 手，唐韦星上前代替周睿羊接手落子。行至 254 手，在左下角扑得手后，因大势已去，团体五人决定投子认负。

团体赛结果

另外，据谷歌消息，在下午的团体赛中，研究室中的柯洁首先提出了在上方靠完尖的下法，对此其他高手并不认同。不久之后，AlphaGo 就在 60 手使出了一模一样的着法！

各方言论

柯洁此前已经表示今后已不打算再和机器比赛，本次人机大赛之后，对围棋顶级水平的探索是否会进入机器对机器比赛的阶段？对此，一直在与机器之心共同观战的阿尔伯塔大学教授 Martin Müller 表达了自己的看法：「我非常期待未来机器之间的比赛，虽然目前看来 AlphaGo 在这方面领先的优势非常大，但腾讯绝艺等团队也有着强大的实力。而随着相关技术的开源，计算机的围棋水平将会继续提高。我期待在未来能够出现更多像日本计算机围棋『电圣战』这样的比赛，这也可以进一步提升围棋的水平。」

「对于 AlphaGo 来说，团队目前还没有对未来的计划发表言论，但我认为他们还会继续致力于提升 AlphaGo 的能力，这是检验人工智能并开发新技术的一个好途径，而且 Hassabis 等人也乐于继续在这方面投入。」

在昨天 AlphaGo 与柯洁第二场比赛的进行过程中，DeepMind 首席执行官 Hassabis 在社交网络上表示：此时在 AlphaGo 的计算中，柯洁的表现是完美的。这引起了人们对于 AlphaGo 对于棋局形势判断方式的好奇。

赛后，樊麾透露了 Hassabis 这句话的内因：在黑白两方在右上角缠斗的时候，柯洁和 AlphaGo 的下法和 AlphaGo 系统中预测的行棋步骤完全一样，这是机器认定的最优解。Hassabis 本人表示，「我们一直在后台关注整个比赛的情况，我们看到柯洁的表现非常完美，前 100 步是目前为止和 AlphaGo 与人类棋手之间最势均力敌的比赛。前 100 手两人差距非常小，我认为双方在前半部分都有机会。」

在今天的比赛中，连笑和古力与 AlphaGo 的合作具有象征意义，它或许会成为人工智能协助人类探索未知世界的一次预演。明天，AlphaGo 和柯洁将展开本次人机大战的最后一场比赛，柯洁能否抓住最后的机会扳回一局？让我们共同期待。

点击阅读原文，查看机器之心 GMIS 2017 大会官网↓↓↓

登录查看更多

相关内容

AlphaGo

关注 21

AlphaGo 是一款人工智能围棋程序，由被 Google 收购的 DeepMind 公司开发。 2015年10月，AlphaGo v13 在与职业棋手、欧洲冠军樊麾二段的五番棋比赛中，以 5:0 获胜。2016年3月9日 - 15日，AlphaGo v18 在与韩国职业棋手李世石九段的五番棋比赛中，以 4:1 获胜，赛后，AlphaGo 荣获韩国棋院授予的「第〇〇一号名誉九段」证书。2016年7月19日，AlphaGo 在 GoRantings 世界围棋排名中超过柯洁，成为世界第一。

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

122+阅读 · 2020年5月18日

【马老师推荐】阿里巴巴-浙江大学医学院附属第一医院《新冠肺炎防治手册》

专知会员服务

19+阅读 · 2020年3月23日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日