戴密斯·哈萨比斯 | 图片来源:Wired
来源 WIRED.UK
作者 Greg Williams
编译 桑颂
编辑 魏潇
戴密斯·哈萨比斯(Demis Hassabis)——前儿童国际象棋神童、剑桥大学双学科绩优生、世界智力运动会(World Mind Sports Olympiad)五届冠军得主、麻省理工学院(MIT)和哈佛大学校友、游戏设计师、青年创业者,以及人工智能(AI)创业公司 DeepMind 的联合创始人——此刻正头戴黄色头盔,身着高领夹克和工装靴,站在国王十字街区(King’s Cross)的一个屋顶上注视着伦敦,这是一个能够从各个方向俯瞰这座城市的地方,在这里他能望到通往海格特(Highgate)的斜坡,他和他的家人就住在那里。
他来到这里是为了巡视 DeepMind 正在建设的新总部大楼,这家公司于 2010 年由他和伦敦大学学院(University College London, UCL)的研究员塞恩·雷格(Shane Legg)以及童年挚友穆斯塔法·苏莱曼(Mustafa Suleyman)一同创建。虽然世人都默认 DeepMind 是一家科技创业公司,但它目前的主要业务仍是科学研发,而且已经在学术期刊上发表了数百篇论文——这和那些人工智能研究机构做的事情没有什么区别。这栋由 500 个建筑承包商打造的大楼计划于 2020 年中投入使用,象征着 DeepMind 的新起点。
DeepMind 官网对研究成果的介绍
新总部的位置位于国王十字车站以北,以“知识街区(Knowledge Quarter)”闻名。DeepMind 创建时,伦敦的大部分创业公司还在屈从于旧街(Old Street.)的影响力。但哈萨比斯和他的合伙人却有着不同的愿景:“破解人类智能之谜”,并发展通用人工智能(AGI)——更加强大的、能够应用于多领域的 AI。到目前为止,AI主要是通过构建能够赢得游戏的算法来实现的,比如打砖块、国际象棋和围棋。下一步则是将其应用于科学研究,利用计算机科学来解决化学、物理学和生物学中的复杂问题。
“我们是一家研发为主的公司,” 43 岁的哈萨比斯说。“我们希望离大学近一点,”他指的是伦敦大学学院(UCL),在那里他凭借题为《以神经活动进程为基础的情景记忆研究》的论文,获得了自己的博士学位。“这也是为什么我们喜欢留在这儿,我们仍然离 UCL、大英图书馆、图灵研究所很近,离帝国理工也不算太远……”
哈萨比斯和他的合伙人深知,DeepMind 以它在机器学习和深度学习方面的突破而闻名于世:他们开发的神经网络算法不但精通电脑游戏,还击败了国际象棋大师,并让世界围棋冠军李世乭宣告:“从游戏开始的那一刻起,我就没有一刻觉得自己能赢。”
“人机围棋大战”第二局前99手。| 来源:Wikipedia
过去,机器在与人类的棋类或其他类游戏比赛中会显现出明显的算法特征:应对风格严格且死板。但是在围棋对弈中,DeepMind 开发的人工智能 AlphaGo 以一种近乎人类的方式打败了李世乭。第二局比赛中第 37 手一个极不寻常的举动令那些在首尔现场观战的人们倒吸了一口冷气,并让数百万在线观众感到困惑—— AI 用一种在人类眼中极富创造力的方式走了一步棋。
对于哈萨比斯、苏莱曼和雷格来说,如果 DeepMind 的前九年被认为是他们集中研究强化学习(reinforcement learning)的阶段【这种基于代理系统的理论不仅试图让 AI 建立起所处世界和识别模式的模型(像深度学习所做的那样),也能让 AI灵活地做出决定并努力达到目标)】,那么目前 AI 通过游戏对抗带来的证据将定义下一个十年:即使用数据和机器学习来解决一些科学中最难的问题。哈萨比斯说,他们下一步的工作将从这个问题出发:找到一个方法,让深度学习将强化学习拓展到真实世界的问题中。
“强化学习的缺点在于它一直集中于解决于小玩具式的问题,这就像网格一样规律又简单,”他说。“人们觉得它可能无法拓展到混乱真实的现实问题,这才是我们想把强化学习和深度学习联合起来并起到作用的地方。”
对于 DeepMind 来说,新总部的修建象征着公司的新篇章——努力将研究的影响力和计算能力转变为对构筑有机生命的单元的理解。这家公司希望通过这种做法能够在医学和其他学科取得对多个领域产生影响的突破。“我们的任务将是科学发展史上最迷人的旅程之一,”哈萨比斯说。“我们正在努力建造一个科学进取的殿堂。”
在 UCL 和 MIT 求学期间,哈萨比斯发现跨学科合作成了热门。在他的回忆里,研讨会是由来自不同学科如神经科学、心理学、数学乃至哲学的学者们参与的。研究者们在回到自己所属院系前会进行几天的交流和辩论,并说好要定期聚会、寻找合作方法。但是下一次会议很可能在一年之后才能召开——申请经费、教学任务以及研究和学术生活都会妨碍这种跨学科合作。
“开展跨学科研究很难,”哈萨比斯说。“假设有两位在数学和基因组学领域世界领先的科学家——显然这之间存在一些交叉——但是谁来充当理解他人领域的工作、术语以及真正问题的角色呢?”
即便找到了该领域存在的真正问题,那么为什么这个问题还没有被解答?如果没有得到解答,那么它面临的棘手困难是什么?这在外人看来可能很简单。但是即使是处于同一学科的科学家,也不总是用同样的方式来看待他们的工作。而且众所周知的是,学者们很难为其他学科增添价值,找到一个能一起攻克的共性问题就更难了。
现在的 DeepMind 总部——实际上就是国王十字街区 Google 大厦中的两层——近年已越来越知名。仅公司的 AI 研究就集中了六到七个学科,在扩大影响范围的同时还一直在招募数学、物理学、神经科学、心理学、生物学和哲学方面的专家。
“科学最有趣的领域在于学科间的断层和交叉,”哈萨比斯说。“我努力建设 DeepMind 是为了寻找‘粘合剂人才’——那些在多个领域都处于世界一流水平的人才,拥有找到不同学科之间相似之处和连接点的创造力。”
普什米·科里(Pushmeet Kohli)就是“粘合剂人才”中的一员——这位微软研究院(Microsoft Research)的前任主管,现在正领导着 DeepMind 的科学团队。那段几乎没有任何实际进展的“ AI 寒冬”在过去十年已经结束。如今,面临类似困境的,是蛋白质折叠预测。
蛋白质结构示意图。| 来源:Pixabay
科里汇集了一支由结构生物学、机器学习和物理学专家组成的团队来迎接这项重要问题挑战。蛋白质是所有哺乳动物生命的基础,它们在分子水平上搭建起了组织和器官的大部分结构和功能。它由氨基酸序列构成,氨基酸序列的折叠结构决定了蛋白质的形状,进而决定其功能。
“蛋白质是有史以来最令人叹为观止的机器,它允许原子在纳米尺度移动,化学效率是人造机器的 10n 倍,”约翰·江珀(John Jumper)说,他是 DeepMind 的蛋白质折叠研究者。“这些自组装机器非常不可思议。”譬如,蛋白质对细胞的每种功能来说都是必需的,而错误折叠的蛋白质被认为是导致帕金森、阿茨海默症和糖尿病等疾病的关键因素。
“如果了解蛋白质自然形成的过程,我们自己就能够构建它,”江珀说。“是时候看清这个复杂的微观世界了。”
蛋白质折叠问题能够吸引 DeepMind 团队的原因还包括基因组数据集的广泛应用。从 2006 年开始,DNA 数据的采集、存储、传递和分析开始激增。研究人员推测到 2025 年时,可能已经有二十亿个基因组数据集被分析,这需要占据 40 EB(exabyte,1 EB = 1024 PB = 1048576 TB)的储存容量。
“从深度学习的角度来这是一个很好的问题,因为人类付出了巨大的金钱、复杂性和时间(投入)成本,我们用来理解蛋白质结构的惊人资源已经到位,”江珀说。
取得进展的同时,科学家们也在警惕虚假繁荣的泡沫。备受尊敬的美国分子生物学家塞勒斯·莱文索尔(Cyrus Levinthal)冷静地表达了这项挑战的复杂性,他指出在得到正确的三维结构之前,找出一种代表性蛋白质所有可能结构所需的时间,可能比整个宇宙的发展进程还要长。“搜索空间非常巨大,” DeepMind 的研发科学家里奇·埃文斯(Rich Evans)说,“比围棋还要大。”
无论如何,在 2018 年 12 月墨西哥坎昆举行的蛋白质结构预测技术关键评估(Critical Assessment of Techniques for Protein Structure Prediction,CASP)大会中,DeepMind 通过已知的氨基酸序列预测蛋白质结构,取得了里程碑式的进展。
他们的参赛代表是 AlphaFold——他们在之前两年间开发出的新 AI。组织方会提前向参赛成员发送数据集,后者则在不知道是否正确的情况下发回他们的预测结果。一共有 90 个蛋白质结构需要预测,其中一些是已经有模板的预测目标,参赛者能使用已解析出结构的蛋白质作为参考,而另一些则要从头开始建模。DeepMind 团队的最终赛果可以称得上辉煌:AlphaFold 总体上比其他团队更准确,一些指标远超其他团队,在需要从头建模的 43 个蛋白质序列模型中,AlphaFold 精准预测了 25 个,并且优势十分明显——第二名只成功预测出了 3 个。
AlphaFold在CASP13比赛中预测的蛋白质三维骨架可视化图。| 来源:Wired
此次预测竞赛的参与者、来自哈佛医学院的穆罕默德·阿尔库雷希(Mohammed AlQuraishi)表示:“我承认他们做得很好,但却没想到会那么好。”
根据阿尔库雷希的介绍,DeepMind 使用的方法与其他实验室是类似的,但其独特之处在于它们能够“更好地完成”。他同时指出了 DeepMind 团队在工程方面的实力。
“我认为他们能够比学术团队做得更好,因为这个领域的学术团队往往不愿公开自己的成果,”阿尔库雷希说。“而且,即使 DeepMind 将他们对算法的构思公之于众让大家独立地尝试,也没有人能将它们整合起来。”
阿尔库雷希将机器学习领域的学术团体做了个对比,近年来像 Google Brain、DeepMind 和 Facebook 这类公司经历了一些大规模的变迁,它们的组织结构变得更加高效、薪酬待遇更为充足,而且拥有大学里没有的计算机资源。
“在一定程度上来说,机器学习领域的计算机科学团体在过去的四到五年中已积累了丰富的经验,”他说。“计算生物学(Computational biology)在崭新的现实面前才刚刚苏醒。”
这与 DeepMind 的创始人在 2014 年 1 月被 Google 收购时的解释相呼应。Google 庞大的计算设备网络能够使公司更快地推动研究进展,而 4 亿英镑(约合 34 亿人民币)的支票让雇佣世界一流人才成为可能。哈萨比斯描述了招募适合特定研究领域的目标人才的策略。“我们的路线图告诉我们哪个学科领域或者 AI /神经科学的哪个子领域将是重要的,”他说。“然后我们就去找到相应领域中最优秀的人。”
“像 DeepMind 这样的公司,我认为研究蛋白质折叠是一个很好的起点,因为它的问题很明确,并且有能够使用的数据,你几乎像是在处理一个纯粹的计算机科学问题。”阿尔库雷希说。“在其他的生物学领域则不太现实,它们更麻烦。因此,我并不认为 DeepMind 在蛋白质折叠方向取得的成功能够自动转化到其他领域。”
作为一家研究型企业,DeepMind 的项目管理体系非常庞大。每 6 个月,高级项目经理会审查优先事项、重新组织一些项目并对团队成员尤其是工程师们进行激励、并进行人事调整。学科交叉是常见且有意为之的。公司的许多项目周期都比较长,通常在两到四年之间。但是,尽管 DeepMind 的信息一直围绕其研究,它现在是 Google 母公司——Alphabet 旗下的一个子公司,同时也是全球排位第四的最有价值公司。在伦敦的学者期望他们能够参与长期、开创性的研究的同时,加利福尼亚的高管们则会留心他们的投资回报率。
曾有媒体报道,DeepMind 近年来接连亏损,其 2018 年亏损已达 5.72 亿美元(约合 40 亿人民币)。可以明确的是,钱大部分都贡献给了旗下员工:DeepMind 雇用数百名昂贵的研究人员和数据科学家,但并没有产生任何重大收入。2018 年,DeepMind 为约 700 名员工花费了 4.8 亿美元,员工平均年薪高达 400 万人民币,比 2017 年增加了近一倍。
“我们关注产品,我们希望 Google 和 Alphabet 是成功的,并且能够通过我们正在进行的研究获取利润——他们拥有 DeepMind 编程的数十种产品和背后的技术,重要的是这是一种推动而不是拉动,”哈萨比斯说。
“许多产业研究都是产品导向的,”哈萨比斯说。“问题在于你只能做增量研究,这不利于开展重大突破所必须的、有雄心高风险的研究。”
哈萨比斯提到,大型制药公司会为研发投入数十亿美元:在季度盈利报告的推动下,制药行业随着失败成本的增加变得愈加保守。根据创新基金会 Nesta 2018 年的一份报告,在过去 50 年中,生物医药研发生产力稳步下降——尽管公共和私人投资大幅增加,但新药的开发成本越来越高。该报告指出,“开发新药的成本呈指数增长,这直接反映在研发支出的低回报率上。最近的一项估计显示,全球最大的制药公司的回报率为 3.2% ; 同样,德勤的研究估计,生物制药的研发回报率从 2010 年的 10.1% 降至 2018 的 1.9%,达到了 9 年来的最低水平。
“看看大多数大型制药公司的首席执行官,他们不是科学家,而是来自财务部门或营销部门,”哈萨比斯说。“这对组织有什么影响?这意味着公司要从已经发明的东西中挤出更多利润,比如削减成本或拓展市场,而不是真正发明新东西——这更有风险。你不能就这么轻易地把电子表格里的研发成本砍掉。这不是一种富有创造力的思维方式......
对于许多创业者来说,他们常拥有一个机缘巧合的起点——他们遇到了让自己下定决心解决的问题,偶然遇到了合伙人或投资人以及拥护自己想法的学者。但对哈萨比斯来说情况并非如此,他有目的地做了一系列决定——其中一些甚至是在生命中更早的阶段就定下了的,而这些决定最终促成了 DeepMind 的诞生。“这是我穷尽一生来抵达的目标,”他说。“从游戏设计,到游戏对抗、学习神经科学和编程、大学期间学习 AI、去许多世界顶级机构深造、攻读博士学位的同时开始创立自己的早期事业……我已经尽可能地用上了自己的每一点经验。我很明确,在每个人生路口做出的选择最终汇聚在一起,形成了我目前的人生。”
即便公司已经准备搬到新的总部,哈萨比斯仍认为 DeepMind 还是一家创业公司,正在与世界上其他国家(如中国和美国)的公司进行竞争,“有许多大公司在试图做这些事情,”他说。他提到,尽管取得了进展,但 DeepMind 在破解人类智能之谜、建立 AGI 上仍有很长的路要走。“我仍然希望我们保持有一个创业公司应该有的渴望、节奏与活力。”
DeepMind 的员工们站在国王十字街区的屋顶上。| 来源:Wired
创新是困难且孤独的。建立一个组织的流程和文化,使其能够“在世界中有所作为,”——就像史蒂芬·乔布斯(Steve Jobs)告诉团队开发 Mac 计算机那样,很少有企业或者机构能够在多领域发展出多条产品线。随着 DeepMind 的发展,创始人需要寻求前路,同时密切留意在未来几年中可能成为最具变革性的技术,这其中充满着潜在的危险及机遇。
“你会度过许多艰难的日子,我认为在一天结束时,努力赚到很多钱或其他任何事情都不足以帮你度过那些真正痛苦的节点,”哈萨比斯说。“只有真正地怀有热情并坚定地相信自己所做是真正重要的事情,才能让你渡过难关。”
本文来自微信公众号“科研圈”。如需转载,请在“科研圈”后台回复“转载”,或通过公众号菜单与我们取得联系。原始文章请点击“阅读原文”。