AlphaGo单挑五虎将获胜,连笑配对AlphaGo笑到最后

2017 年 5 月 26 日 机器之心

机器之心原创

作者:李泽南、杜夏德


经历过 AlphaGo与柯洁第一场势均力敌,第二场热血沸腾的比赛之后,今天,乌镇围棋峰会进入了配对赛与团体赛的争夺。上午 10:59 分,连笑八段联手 AlphaGo 执白战胜古力九段与 AlphaGo 的组合,赢得了史上首次人机配对赛。而在下午 16::32 时,五位世界冠军组成的团队在与 AlphaGo 的对决中收官阶段认输,团体赛告于段落。



前所未有的人机赛制


今天 AlphaGo 与人类展开了两场比赛。在配对赛中,由「古力九段+AlphaGo」对战「连笑八段+AlphaGo」。比赛中,人类棋手除了要理解 AlphaGo 的风格,还要与之合作。每方有 1 小时的思考时间,人和 AlphaGo 交替落子,用时结束后只有 1 次 1 分钟的读秒。双人赛最早来自日本,该国的双人围棋协会独立于日本棋院,其宗旨就是推动双人赛。双人赛的好处是,对于棋手来说,输赢心理负担会减半。


在中午开始的团体赛中,五位来自中国的世界冠军级棋手组成团队,共同面对 AlphaGo。每方有两个半小时,用时结束后将有 3 次 1 分钟读秒。出战棋手为芈昱廷九段、时越九段、唐韦星九段、周睿羊九段、陈耀烨九段。五名风格截然不同的棋手和 AlphaGo 共同为我们献上了一局精彩的比赛。


本次人机对战中引入的相谈棋赛制对于 AlphaGo 来说也是前所未有的经历,所以格外引人注目。在以往人类棋手相谈赛中,其有利之处在于计算精确,每一步棋都是经过团队充分讨论决定出来的,因为个人很难看到局中的勺子,即围棋对局中出现明显漏招、误算。所以棋局质量很高;然而这种团队作战也会掩盖棋手的个人特色,也有棋手抱怨团队协作时存在沟通问题。日本棋手苏耀国曾在 2013 年首届世界围棋团体赛中表示,团队之沟通很难。不知道这一点是否给 AlphaGo 带来了更多优势。


配对赛:AlphaGo 要认输,遭古力拒绝后落子消极


早上 8:30 开始的配对赛同样采取中国规则,人和机器轮流落子。现年 23 岁的连笑八段执白,34 岁的古力九段执黑。黑棋上来还是点了三三。AlphaGo 走棋悬念连连,在这种情况下,人类棋手也连出奇招。相较于柯洁的比赛,人机配对赛中,双方下子很快,同时因为 AlphaGo 的加入,两方实力差距大幅缩小。



连笑执白在布局阶段率先发起攻势,但双方在右下角的缠斗却为黑棋造出了厚势。随后在右上角的争夺中,连笑选择脱先,70 手跳至天元试图形成大模样。由于处于落后形势,连笑的思考时间很长。行至 154 手,连笑与 AlphaGo 联手在棋盘左边下出险手,成功侵占了黑棋的大空。行至 200 手,全场占据优势的黑棋一方出现了分歧,AlphaGo 的代表举出了认输的牌子,但遭到了古力的拒绝,比赛继续(据古力介绍,AlphaGo 认输,人类有权拒绝,但如果人类选手认输,AlphaGo 则不能拒绝)。随后古力在很多步骤中陷入长考,双方均进入读秒阶段,古力在勉力支撑之后无力回天,在 220 手选择投子认负。


古力在赛后采访中表示,双方进入交战后,他与 AlphaGo 的意见开始出现明显分歧,自己出现失误,错过了一个大劫,导致局势逆转。因为这个大劫,己方的 AlphaGo 可能没有发挥出最高水平。古力自嘲自己把「胜率从 75% 下到了 45%。」


获胜方连笑在接受采访时称开局与 AlphaGo 配合有点困难,把队友带入了一条不归路,自己的队友不如对方的 AlphaGo 稳健,感觉很像人类。



团体赛:相谈棋五人联手未撼动 AlphaGo


从左至右:时越、芈昱廷、唐韦星、陈耀烨、周睿羊


中午 12:30 团体赛开始,猜先后,由周睿羊代表人类棋手一方执黑棋,黄士杰博士代表 AlphaGo 执白。布局阶段波澜不惊,人类方吸取了上午比赛的教训,选择了三三布局而非星位。比赛中,团队五人时常出现分歧,长考频出,耗时较快。行至 42 手棋时,AlphaGo 再次在右上角点三三,这一招目前已成为 AlphaGo 的招牌进攻方式,并已被职业棋手效仿应用。



行至 45 手棋时,白方为节省时间派出陈耀烨短暂上阵摆棋。随后周睿羊回归,AlphaGo 在 54 手时再次出现保守打法,行棋稳健,似乎胜算在握,意图显现。


行至 70 手,形势落后的人类团队决定在上边屠杀白棋大龙,但被白棋在 80 手大飞化解。随后两方在右上角展开劫争,双方消耗劫材。到 133 手,黑棋在右上角开劫,侵蚀了右上角白棋的领地。比赛逐渐进入收官阶段。至 186 手,唐韦星上前代替周睿羊接手落子。行至 254 手,在左下角扑得手后,因大势已去,团体五人决定投子认负。


团体赛结果


另外,据谷歌消息,在下午的团体赛中,研究室中的柯洁首先提出了在上方靠完尖的下法,对此其他高手并不认同。不久之后,AlphaGo 就在 60 手使出了一模一样的着法!


各方言论


柯洁此前已经表示今后已不打算再和机器比赛,本次人机大赛之后,对围棋顶级水平的探索是否会进入机器对机器比赛的阶段?对此,一直在与机器之心共同观战的阿尔伯塔大学教授 Martin Müller 表达了自己的看法:「我非常期待未来机器之间的比赛,虽然目前看来 AlphaGo 在这方面领先的优势非常大,但腾讯绝艺等团队也有着强大的实力。而随着相关技术的开源,计算机的围棋水平将会继续提高。我期待在未来能够出现更多像日本计算机围棋『电圣战』这样的比赛,这也可以进一步提升围棋的水平。」


「对于 AlphaGo 来说,团队目前还没有对未来的计划发表言论,但我认为他们还会继续致力于提升 AlphaGo 的能力,这是检验人工智能并开发新技术的一个好途径,而且 Hassabis 等人也乐于继续在这方面投入。」


在昨天 AlphaGo 与柯洁第二场比赛的进行过程中,DeepMind 首席执行官 Hassabis 在社交网络上表示:此时在 AlphaGo 的计算中,柯洁的表现是完美的。这引起了人们对于 AlphaGo 对于棋局形势判断方式的好奇。


赛后,樊麾透露了 Hassabis 这句话的内因:在黑白两方在右上角缠斗的时候,柯洁和 AlphaGo 的下法和 AlphaGo 系统中预测的行棋步骤完全一样,这是机器认定的最优解。Hassabis 本人表示,「我们一直在后台关注整个比赛的情况,我们看到柯洁的表现非常完美,前 100 步是目前为止和 AlphaGo 与人类棋手之间最势均力敌的比赛。前 100 手两人差距非常小,我认为双方在前半部分都有机会。」


在今天的比赛中,连笑和古力与 AlphaGo 的合作具有象征意义,它或许会成为人工智能协助人类探索未知世界的一次预演。明天,AlphaGo 和柯洁将展开本次人机大战的最后一场比赛,柯洁能否抓住最后的机会扳回一局?让我们共同期待。



点击阅读原文,查看机器之心 GMIS 2017 大会官网↓↓↓


登录查看更多
0

相关内容

AlphaGo 是一款人工智能围棋程序,由被 Google 收购的 DeepMind 公司开发。 2015年10月,AlphaGo v13 在与职业棋手、欧洲冠军 樊麾二段 的五番棋比赛中,以 5:0 获胜。2016年3月9日 - 15日,AlphaGo v18 在与韩国职业棋手 李世石九段 的五番棋比赛中,以 4:1 获胜,赛后,AlphaGo 荣获韩国棋院授予的「第〇〇一号 名誉九段」证书。2016年7月19日,AlphaGo 在 GoRantings 世界围棋排名中超过柯洁,成为世界第一。
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
45+阅读 · 2020年5月23日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
一张图看懂AlphaGo Zero
AI前线
6+阅读 · 2017年11月17日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
7+阅读 · 2018年8月28日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
VIP会员
Top
微信扫码咨询专知VIP会员