而吴翼的暴走升级之路,也正是从他尽全力去探索更多的可能开始。“也许是性格使然,也可能是看的和想的比别人早了一点,而自己的运气也确实比较好。“几次人生分叉口做的决定,吴翼认为都有运气成分,甚至好几次用“奇葩”来形容。但毫无疑问,每一个被他自嘲为“奇葩”的结果背后,其实都有着常人难以接触或者理解的理由,幸而这些“不走寻常路”的决定最终收获的结果还不错,这些瞬间也被吴翼称为“走了狗屎运”。吴翼在姚班一共度过了三个暑假,每个暑假都在外面实习,而且都不在国内。第一年有幸入选校级访学团作为学生代表去了英国访问,第二年去了美国 Facebook 实习,第三年则去了伯克利。去 Facebook 实习的经历就充满着各种巧合。吴翼先找到了姚班的学长唐文斌,说想去谷歌实习,本来是打算去隔壁的谷歌中国。唐文斌听成了 Google 的美国总部,找了二字班的大师兄张一飞(IOI 2000 金牌、IOI 2002 金牌),以为他在 Google ,结果当时张一飞刚刚跳槽到 Facebook 。一天,吴翼莫名其妙收到一封 Facebook 的邮件,阴差阳错就给了一个面试,面试完了就拿到实习的 offer。于是,2012 年 6 月,吴翼去了美国。那年 Facebook 刚上市,股票一直狂跌;公司还只有 3000 人,扎克伯格在反复说着 Mobile First (移动优先),希望带领公司转型。大二的吴翼第一次见识了“资本主义的腐朽生活”:作为实习生,Facebook一边发着实习工资,还包了一间带家具的公寓,美国精装修,还带游泳池和健身房。对于这段经历,吴翼笑称当时应该把所有的实习工资都拿来买Facebook的股票,到现在不知翻了多少倍了。另一段“穷折腾”的实习经历是2013 年暑假,吴翼来到伯克利实习。正是因为这段伯克利的实习经历,让 Stuart Russell 教授对吴翼留下了深刻的印象,才有后来受 Stuart Russell 教授的邀请去读博的下文。图注:吴翼(左)与 Stuart Russell 教授(右)合影读博期间,吴翼专攻概率编程语言方向。“他(Stuart Russell)当时觉得整个人工智能界面临的最大难题出在这,而伯克利的博士就应该挑战最难的问题,因为他是从更高的层次给出的判断,所以他不会将就你,甚至都不在乎你是否发了论文。”然而 2016 年那会,人工智能界因为深度学习的发展面临剧变,敏锐的吴翼嗅到了革命气息,有意转换科研方向,却因为一直未能明确想要转换的方向,始终没勇气向 Stuart Russell 教授阐明内心的想法。思索再三,吴翼最终决定敲开伯克利大学 Pieter Abbeel 教授的大门,表示愿意跟他合作相关研究工作。在获得 Pieter Abbeel 教授的应允后,吴翼便开始了科研“双栖”生活,而Stuart Russell 教授也很开明,对他的选择表明了支持的态度。当时 Pieter Abbeel 教授组里正好有三个研究项目在进行中,他让吴翼自行选择愿意加入的组别。吴翼万万没想到的是,这次的选择会让他获得 NIPS 2016 年度最佳论文奖。“第一篇深度学习论文就获得最佳论文还是挺罕见的,虽然我知道他们那个项目是个很火的方向,但 Pieter Abbeel 教授当时就 123 给我自己选,谁也不会料到会是这个结果对吧?”自此之后,吴翼建立了对自己的信心,读博的“坎”也就这么被他跨过去了。找到深度学习的方向后,吴翼在伯克利读博的 5 年时间里,继续开启了暑假实习生涯。2016 年 5 月,吴翼回国呆了 4 个月,去了今日头条的 AI Lab 实习。当时 AI Lab只有 5 个人,吴翼、李磊、2 名全职工程师以及 2 名实习生。李磊也是 3 月份才过去。吴翼和李磊的相识可以追溯到高中时期。他们是江苏常州高级中学的校友。在中学时代,李磊一直是吴翼的榜样,他们在李磊的一次回校访问期间相识。而另一层关系是,李磊是吴翼导师 Stuart Russell 教授的博士后(2011-2014),吴翼到伯克利的实习就是李磊发的邀请。很巧的是,那时候头条也是 3000 人,做大数据的只有 300 人。张一鸣在全体会上,说要 all in 短视频。2016 年快手刚火,吴翼在做暑假实习时,抖音还是一个神秘的内部项目,到吴翼回美国之后的寒假,抖音已经正式成为了现象级产品——“就这么再次跟暴富的机会擦肩而过了”,吴翼提及这段经历开玩笑的说道。这些经历后来也培养了吴翼做决定喜欢凭直觉的习惯。“想太多没用,因为你反正也想不清楚。你想好的事情,过了三年可能就完全不一样,世界一直在快速变化。“这种习惯甚至被他带到自己的博士生招生环节当中。去年他招的一名学生,就只凭借在电话里聊的20分钟通话,直觉上“觉得这个人不错”,就决定在学院的招生夏令营中把他给录取了。4
永远年轻
如果不是吴翼亲口提起,我们从未想到,他在 2018 年以前从来没有过“成为老师”的想法,更让人感到意外的是,从回国面试到与叉院签约,吴翼仅仅用了6天时间。18 年暑假,很快要从伯克利大学博士毕业的吴翼决定回国发展。此时,读博期间一直保持紧密合作的今日头条给吴翼开了抵得上“三个国内优秀硕士生”的 offer 。向吴翼抛出橄榄枝的还有地平线的 CEO 余凯,吴翼被余凯拉到地平线总部“洗脑”将近一个小时,他表示脑子当时差点被洗“烧”了。需要补充说明的是,给吴翼开 offer 的并非今日头条人工智能实验室,而是今日头条的产品部门——这是吴翼根据国内发展形势做出的个人选择,原因是想要离产品落地、离用户更近一些。今日头条给吴翼开出 offer 那会,他已经在今日头条的产品部门实习了三个月时间,那是他博士毕业前的最后一个暑假。图注:吴翼在今日头条实习期间,右为今日头条人工智能实验室总监李磊业界赋予的机会并没有让吴翼兴奋太久,他很快又陷入到另一端的权衡思考当中。原来吴翼认为产品可以让他“干成大事”,然而实际到产品部门实习后他发现,个人在产品部门的发展其实受限于“产品”,并非想象中的可以“为所欲为”,而且产品经验也会制肘个人的发挥。“内心总觉得还差点什么,想着会不会有其他地方的发挥空间更大一些。”心里带着疑问,吴翼和家人去了度假。旅途中,他偶然想到姚班的教书机会。旅程结束后,他立马向姚班的徐葳老师咨询学院的招募详情。徐老师当时给他的建议是:尽早回国面试。当年 10 月,吴翼如约飞向北京。他记得非常清楚,学院的面试安排在周一,他在周四落地北京,周一清华面完试,周二便把offer给签了,所有流程一气呵成。“当时姚先生给了我一份offer,说你看下,一会要签字,我说姚先生我不看,你给我就签。”正式入职清华交叉信息研究院以前,折腾惯了的吴翼又向姚先生提出另一个“奇葩”的要求——他申请在美国业界待一年时间,积累对实际应用场景的理解。这个决定得到姚先生的爽快答应。原来心中首选是谷歌的吴翼,最终因为谷歌入职手续问题,投向了OpenAI的怀抱。成立于 2015 年底的 OpenAI,其目标是创造出通用人工智能(AGI),过往最为人所津津乐道的成果包括击败了《Dota 2》游戏的前世界冠军的 OpenAI Five ,以及自然语言处理模型 GPT。“后来觉得自己其实去对了,OpenAI的组织形式挺难得,它就像是一个大型实验室,在完全不碰产品的情况下,每个团队都安排很多人去攻克一个纯学术项目,然后工程与计算资源任你使用。”在OpenAI,吴翼参与了一个智能体捉迷藏项目。简单来说,就是让智能体分为红队与蓝队两组进行捉迷藏游戏,后来研究结果发现,仅仅使用简单的+1/-1奖励,以及大规模强化学习、智能体自动进化,便掌握了工具使用,并总结出了6个不同的套路和反套路。图注:OpenAI 智能体捉迷藏项目为了能够量化研究智能体行为的复杂性,吴翼所在的OpenAI团队提出了5个不同的智能体测试,在这些测试中,通过强化学习得到智能体都能够得到最高的分数。吴翼最后也总结了这个工作的核心点:多智能体强化学+复杂模拟环境→类似人类的智能行为。这项研究当时在全世界引起极大反响,相关视频在 youtube 上点击量很高。吴翼极为珍惜这段工作经历,这种毫无顾虑地投入去做自己想做的事的经历像极了姚班,但在工业界却极为少见。2019年,吴翼如约回到国内。离开 OpenAI 之前,吴翼还帮不少朋友搞到了 GPT-3 的访问权限,之后就很难申请到了。刚入职清华大学交叉信息研究院不久的吴翼,已经开始感受到了背负在肩上的压力。这种压力源自于姚先生对新教师们无条件的信任——只要有相关资源,姚先生都会不论资质分享给大家。“如果我是其他院系一名刚入职的老师,可能需要先待一段时间才会有这样的资源倾斜。”这段时间,清华大学交叉信息研究院在西安的硬件研究院、上海的 AI 研究院、南京的图灵研究院、北京海淀区的海华研究院都陆续建成,这些研究资源都属于年轻助理教授们的“宝库”;而吴翼也在用自己过去在姚班学习的经历帮助学生的成长,他深知个性化的教育才能教育出个性化的人才,因此也试着像姚先生一样,给学生们更多自由发展和“另起一行”的机会。“要是早 4 年加入,那时学院的重心还是在理论计算机,后面可能会遇到一些发展的转型,而现在院里对于 AI 的支持都已经很完备了。换句话说,现在其实是入职最佳时机,所以又一次验证了,我的运气确实真的挺好。”谈及自己在清华的工作,吴翼毫不掩饰其语气中的神采飞扬。要说吴翼为什么能够拒绝工业界的诱惑,或许是因为他依然保有着对这个世界最初的热情和好奇,以及和学生们在一起能永远年轻吧。毕竟一个时刻准备着尝试,无所谓失败翩跹少年,更能发现这个世界的美好。 5
对话吴翼
1. AI 科技评论:你什么时候停止打竞赛的?吴翼:你知道年纪大了之后,比赛场上写不了 100 行以上的代码了(笑)。写代码比不过年轻人。不过后来我在伯克利还当了几年 ICPC 的教练。伯克利的选拔比赛,一直是我在帮忙张罗。毕业离开伯克利后,就没有时间再参与ICPC了。但是我自己每年还是会稍微做一做题目,锻炼下智商。如果以后有可能,可以组一个老年队叙叙旧,娱乐一下。2. AI 科技评论:参加竞赛对于编程能力是不是很有帮助?吴翼:竞赛就是算法+编程。大公司的面试其实也是这样,为什么面试这两个呢?第一,如果能学懂算法,一定不会笨;第二,竞赛的学生,代码能力能力一定不会差。但是代码能力究竟有多好,其实也不好说。毕竟竞赛是在 3 个小时或者 5 个小时做个 10 道题,一道题平均下来也就是半个小时的时间。真到做项目的时候不一样了,一年半载的做一个大项目,需要很多完全不一样的工程能力。没参加过竞赛的,有没有大神?肯定有,而且有不少。我就认识一些从来没参加过任何竞赛的朋友,后来做系统、做算法特别厉害。当然大公司确实喜欢竞赛出来的,因为竞赛往往比他们的面试题考察的准一些。一般竞赛获奖的同学都挺能干事情的。3. AI 科技评论:在每一次做抉择时,清华的校友网络还是有挺大帮助的?吴翼:很多师兄师姐确实都对我帮助很大。师兄师姐对我都非常热情和真诚,我特别感谢他们。你别说,我一个小爱好就是翻名单,到了姚班之后,往前一直翻了好几年。一路上真是碰到好多学长。去 MSRA 是张峥东学长介绍;去 Facebook 是唐文斌帮我,实习期间的室友是吴景岳学长,当时还有许许多多在硅谷或者旅行途中遇到的师兄师姐,所以差不多大二的时候就知道美国的工业界和学术界大概是怎么样了。不过后来一个让我感到满难过的事情,是我在伯克利呆了五年,都没有学弟学妹来找过我。可能是我不打广告,或者像我这样喜欢翻名单的人确实比较少。4. AI 科技评论:您对姚先生的印象是怎样的?吴翼:姚先生就是对学生很关照。他给了学生太多的机遇。从当老师的角度来说,他也帮我们争取到了很多资源,因此我们可以将更多精力放在教学和科研工作上。姚先生对我们很器重,但其实压力也挺大,你得把该做的事情真正做好。如果最后没有做好,挺辜负姚先生的期望,然后自己心里也会非常过意不去。姚先生真的对我们很信任,他觉得我们的能力是够的,有好的资源就直接交给我们。5. AI 科技评论:最后一个问题,清华对你意味着什么?吴翼:我一般不考虑这样的问题,就好比你问我当初追我太太意味着什么?那肯定是当时认识她的时候喜欢她呀,哪有那么复杂的(当然,只是没想到最后一直喜欢了8年多并且还喜欢得很)。清华对我意味着什么?那就是高中时候的我在清华和交大之间最后觉得清华可能更适合我一些,就这么一件事。当然,很多年过去之后你再回望这件事情的时候,它的意义就是你的人生轨迹了。高中时候我也可以去交大,是吧?我本科毕业是出国还是直接工作,这都是人生的分叉路,做出选择意味着我走了人生特定的一条路。但如果真要去复盘,比如如果我真的去了交大会怎么样,其实也很难说。我高中去交大打竞赛的时候住在交大的学生公寓,当时睡在我隔壁床铺的是罗宇龙,他后来成了饿了么的第一个程序员,现在是饿了么的副总裁。你说如果我直接去饿了么的话和现在相比较会如何?好像挺不好说的。再比如,如果我最后没有进 IOI ,我去了清华计算机系,可能我就去 Face++ 了,因为我同一届的同学,跟我关系很好的陈可卿,他是第 5 号员工。我觉得只要在时代的洪流中,不要走反方向,无非是分叉的问题。2014 年的时候,我那时候在犹豫,我觉得去不了 TOP4,我就不出去读书了,所以只申请了 8 所学校。那个时候,如果有人告诉我有一家小公司叫今日头条很有前途,然后我放弃出国直接去工作会不会现在就已经财务自由了?再退一步,2016 年的时候,如果我没拿最佳论文,然后直接退学了留在头条,加入抖音,好像现在看也不错。但人生哪有那么多如果呢?无非跟着直觉走罢了。戴文渊老说,清华的学生就是选择太多了。人的选择,你只要顺着时代的方向,沿着选择的路一直往前走,最后其实都不错了。