人们谈论说,人还是那个人,狗不再是那只狗——
但这次,狗不再是那只狗,人也不是那个人了。
下午,论智从中新网了解到,刚刚斩获人生第五冠的棋手柯洁在中国棋院宣布,将于明年四月再度对战围棋AI程序:
作为一名棋手,我还是很享受去挑战强大的对手。对我而言弈无止境,下棋是不断挑战自我的过程,下这样的棋是有意义的,是我人生中很宝贵的经历。
这是继今年五月在三番棋中败于AlphaGo后,柯洁首次重燃对AI的战意。
昨日,首届新奥杯世界围棋公开赛五番棋决赛决胜局正式廊坊落下帷幕,柯洁执黑以3/4子险胜另一名中国选手彭立尧,将比分锁定在了3-2。这是新奥杯的首个世界冠军,同时也是柯洁的第五个个人世界冠军。至此,柯洁打破韩国“石佛”李昌镐的记录(21岁295天),成了世界上最年轻的“五冠王”,时年20岁146天。
2015年1月14日,第2届百灵杯决赛柯洁3-2邱峻;
2015年12月8日,第20届三星杯决赛柯洁2-0时越;
2016年1月5日,第2届MLILY梦百合杯决赛柯洁3-2胜李世石;
2016年12月8日,第21届三星杯决赛柯洁2-1胜柁嘉熹;
2017年11月26日,第1届新奥杯决赛柯洁3-2彭立尧。
综观柯洁这一年的成绩,除了在对阵AlphaGo一役上吃了大亏,他的总体表现可圈可点,但也不乏一些起起落落。AlphaGo事件后,柯洁曾以22连胜的成绩夺得媒体瞩目,成为继井山裕太(26连胜)、李昌镐(24连胜)之后的史上第三人。但在放出“和人下棋原来能这么轻松”的豪言后,从8月起他也有走下坡路的趋势,甚至在不久前让出了自己蝉联了38个月的世界第一的位置(8天后又夺回)。
虽然是一个靠AlphaGo起家的“过气网红”,但棋手柯洁对中国围棋的贡献是有目共睹的。围棋是一项高强度的脑力活动,柯洁是人,是人就意味着会妥协、有情感、状态会不稳定。这大半年来,无论是被棋院要求走穴表演,还是仍为AlphaGo一战心中耿耿,亦或是状态掉进了低谷,在夺得新奥杯冠军前,人们不知道他在赛前的战绩是2胜6负,也不清楚他心中的压抑。他在接受采访时表示:
今年刚开始期待很高,特别是刚开始跟AlphaGo下完棋后的连胜,以为没人能阻挡我了,但后来发现阻挡我的人还是很多的。后来我也看开了,努力过就没有遗憾。今年总的成绩还算满意。
现在的柯洁,似乎已经不再是那个曾经口出狂言的世界第一人。天才还是天才,但是他也开始展现出自己作为职业棋手的一面。偶像负责吸引眼球,但棋手不能丢的是对于精益求精的追求。围棋世界胜败无常,你必须有好胜心,但你也要毫无包袱地正视自己的每一场胜利和失败。
今天,第一届“吴清源杯”世界女子围棋赛新闻发布会在中国棋院举行,借着人工智能的势头,主办方又打出了人工智能围棋赛这样吸睛的招牌,来为真正的比赛主体——女子围棋赛造势助威。
一代棋圣,少小离家,随局动荡,最后魂归故里。想依靠围棋打造AI产业的福州市是这么煽情的。而柯洁和女棋手於之莹作为当前国内棋手中的领军人物,这一次又被邀请担任形象大使。简而言之,这还是一场走穴表演。
在女子围棋赛举行期间,一场同期举办的人工智能围棋大赛也会拉开帷幕。据主办方介绍,比赛邀请了腾讯绝艺、天壤、台湾CGI、日本DeepZenGo等来自中、日、韩、欧美等国家和地区的多支AI队伍,届时柯洁将与上海人工智能初创公司天壤智能的AI程序——天壤一决高下。
新奥杯解说界面(天壤也可用作棋局分析)
谈及天壤,人们会把它称为“人工智能界冉冉升起的一颗新星”,它也在本届新奥杯世界围棋比赛上担任了解说,但这个曾在比赛中有过不俗表现的AI并没有收获与其成绩相称的关注度。在“象屿杯”上,它搭档聂卫平负于台湾世界冠军王立诚和人工智能CGI;在龙星战上,它不敌DeepZenGo获得了季军。也许是国人更爱冠军,人们只在这两场比赛里记住了胜者CGI和绝艺。
由于这些原因,我们对天壤知之不多,但在“象屿杯”期间,“天壤”创始人薛贵荣曾透露了一些设计思路:
其实它就是以大量人类的棋谱为起点,然后用两个同样的系统不断对弈,产生人类未必熟悉的棋路。在这个过程中再进行不断地迭代,修正下棋的策略,达到棋力的提升。
粗一看,它类似AlphaGo的强化学习,又似乎带有一些GAN的意味。据不可靠消息,天壤已经达到了AlphaGo Master的水平,但具体表现如何,我们还需要静待比赛给出答案。
此外,届时替天壤执子的不是“黄博士”二号,而是一个由福州大学自动化学院研发的机械臂,恐怕到时候柯洁需要克服的不只是对AI的心理阴影,还有面对一个机械对手的不适感。
相比圈内的浮躁,不再下围棋的AlphaGo前阵子在技术上实现了又一轮突破。
正如论智在AlphaZero一天攻陷3大棋牌游戏,这是RL的成就还是TPU的胜利?提到的,无论是硬件水平过硬,还是算法性能出色,AlphaZero在只有游戏规则的前提下一天内就击败了3类棋牌游戏中的顶级“选手”,这本身就是一个非常了不起的成就。这里我们再对这个新贵进行一番梳理。
众所周知,AlphaGo依靠棋谱数据集和RL进行学习,而它的升级版AlphaGo Zero则更进一步,无需棋谱,仅靠自学就在短期内超越了前辈。这次的AlphaZero是AlphaGo Zero算法的通用版本,它也不再需要借用传统手工搜集整理的数据和游戏的特定技巧玩法进行学习,而是依靠DNN、蒙特卡洛树搜索算法和“白板”强化学习算法不断自我对弈,用评分系统不断训练自己在3种棋类游戏的棋局中占据优势,最后战胜对手。
在DeepMind的实验中,AlphaZero在4个小时内就学会了国际象棋,在2个小时内就学会了日本将棋,并在8个小时内精通了围棋。
AlphaZero国际象棋、将棋、围棋百场对局结果
如上图所示,经过一天训练,它在百场比赛中击败了这些对手。它们分别是2016年TCEC冠军、今年在51场比赛中保持不败战绩的国际象棋AI程序Stockfish,2017年CSA世界冠军、日本将棋AI程序Elmo,以及DeepMind上一篇论文的主角、只训练了3天就超越AlphaGo(李世石版)的围棋AI程序AG0 3(AlphaGo Zero3天训练版)。
当然,AlphaZero也不完全是AlphaGo Zero的重制版,它也进行了不少升级:
AlphaGo Zero只会考虑输/赢两种结果,因此它会不断估计并优化胜率;而AlphaZero会估计和优化比赛结果,并考虑平局或其他潜在的情况。
由于无论怎么调整棋局方位,围棋的规则都不会发生变化,AlphaZero沿用了AlphaGo Zero的方法,会通过增加一些对称数据强化训练,并在蒙特卡洛树搜索期间随机调整棋盘角度进行评估。但考虑到国际象棋和将棋的规则是不对称的,AlphaZero没有增加训练数据,在搜索时也不会改变棋盘位置。
AlphaGo Zero算法提升自我的方式是不断迭代,它会计算每一次训练的表现,如果后一次比前一次更优,那后者会代替前者进行之后的自我对弈。而AlphaZero从头到尾只有一个神经网络,它只通过更新参数来完成自我更新,省去了评分步骤,也不统计最佳状态。
AlphaGo Zero通过贝叶斯优化调整搜索的超参数,而AlphaZero则重复使用相同的超参数,无需针对特定游戏做改变。当然,这一点也有例外,就是AlphaZero为了保证搜索会把噪声添加进之前的动作中,它与合理下法的数量成正比。
纵观这整件事,可以发现这很明显这又是一起炒作,一个噱头,而我们年仅20岁的天才棋手柯洁又成了围棋行业、某些部门,甚至是某些观众的消费对象。
柯洁确实是历代棋手中的一个“异类”,作为这个时代围棋界的棋手,他除了需要取得成绩,还承担着宣传、发扬围棋的使命。和传统体育的没落一样,围棋的没落也许是这个时代的一个必然,人工智能在其中只是充当了催化剂的作用。为了挽救这个传承千年的文化游戏,我们能理解棋手们的苦心。今年10月份,当柯洁因活动过多状态不佳时,聂卫平聂老曾说了一段话:
各个行业的明星不少,但英雄却不多。什么是行业英雄?除了在个人技艺上出类拔萃之外,还要有社会责任感、爱心、善心,传播正能量。在这方面,柯洁做得非常不错,是围棋界的榜样。
非常现实的一番评价,我们呼吁个体价值的实现,但是又对这种流传下来的牺牲小我拯救大我的做法无力辩驳。
日本围棋曾经如日中天,现在已经几乎丧失了全部活力。20世纪初,日本棋院曾出品动漫作品来吸引青少年学习围棋,这在当时确实起到了一点作用,但杯水车薪。前几年,韩国也曾推出一部以曹薰铉、李昌镐、李世石等棋手为原型的电视剧,起到了一些宣传效果。而现在,中国棋院只是针对现在的偶像经济打造了一个围棋偶像,说到底,大家都是为了围棋,为了拯救日薄西山的围棋。
可以说,柯洁的英雄形象是一些人刻意塑造的。他是一个不可多得的天才,也许能在围棋史上创造又一个伟大的神话,但他同时也只是一个普通的一流选手。围棋没有常胜者,天赋、智力、年龄、灵感……它需要棋手沉下心来,钻研努力。当一个天才被冠上人类最强智力去和机器比拼,当他需要履行使命频繁地去参加公益活动,这其实也在消费他的天赋,他是行业的牺牲品。获益者是谁?是围棋本身?是围棋从业人员?是围棋经济?还是AI?其实它们都是,甚至连我们这些普通人,也不能置身事外。
也许最看不惯的,是连冰冷蠢笨的机械臂都要借计算机的算力来踩上人类一脚。
除了吸引更多人关注围棋外,这样的炒作也带来了行业生存之本——资金,无论是人才、比赛还是赛制,虽然许多人一直在批判近年来围棋行业的混乱与浮躁,但饱汉怎知饿汉饥,这是围棋之幸?还是围棋之悲?
最后,让我们观看这几十年来世界top 10围棋棋手的演变视频,来纪念这个逐渐走向回忆的游戏。