X教授肖健雄:普林斯顿学术大神 用1/10的成本搞定自动驾驶

2017 年 7 月 24 日 智东西 origin

独家专访AutoX创始人肖健雄:普林斯顿大学教授投身业界,要用10个摄像头搞定自动驾驶。


车东西  文 | origin

远隔重洋的硅谷,在近几年已成为自动驾驶的中心。从门罗帕克到弗莱蒙特,车厂、互联网巨头、初创公司齐聚于此,同台竞技。在这些向当代最难系统工程之一——自动驾驶发起冲刺的队伍中,不乏东方面孔。AutoX创始人、普林斯顿大学教授肖健雄便是其中一员。

在接受车东西采访之前,身在硅谷的肖健雄刚刚开完了一场持续数小时的会议,此时的北京正是正午,而美国西海岸已经过了晚上10点。

休息了五分钟过后,肖健雄接听了车东西的电话,接受专访,向我们讲述他创办AutoX的经历和想法。

一、“出走”的学术明星

在创办AutoX之前,肖健雄以其学术身份著称。

出生于广东的肖健雄本科和硕士学位在香港科技大学完成。从本科开始,他就研究起了计算机视觉。他的本科和硕士论文,主题是关于三维重建和街景分析。肖健雄在硕士期间所做的三维街景分析成果也影响过谷歌无人车的工作(谷歌无人车早期团队是以谷歌街景为基础)。

硕士毕业后,肖健雄远渡重洋,进入MIT,读计算机博士。在CSAIL那栋奇形怪状的建筑里,肖健雄闷头做了四年研究,专注于以大数据做三维场景分析。毕业前,他拿到了2012年的Google research 最佳论文奖。

(MIT CSAIL计算机科学与人工智能实验室)

从MIT博士毕业后,肖健雄进入普林斯顿计算机系,出任助理教授,搭建起了计算机视觉和机器人实验室,专注于三维计算机视觉在机器人领域的应用,扛起了普林斯顿CV研究的大旗。在普林斯顿期间,肖健雄开辟了两个研究领域:

一是RGB-D场景分析,即同时使用图片中的颜色和深度信息做场景识别;

二是三维深度学习。通过三维的卷积神经网络对三维物体进行识别,对三维场景进行分析。

转化为应用,就是无人驾驶、室内SLAM以及机器人控制。另外,由于肖健雄的姓氏和学术能力,在普林斯顿期间,他还获封“professor X”——漫画里那个拥有超能力的X教授。

作为普林斯顿大学计算机视觉研究的领军人物,2014、2015年连获Google research Award,按理说应是学术生涯的巅峰时期,但肖健雄却急流勇退,转身投向了业界,这是为何?

原因在于肖健雄的“急性子”以及华人资本在硅谷的扎堆。

学术研究发展到当代,已经划分得非常细,一个课题往往只关注在很小的领域。并且,由于学术研究通常限定条件,并带有一定超前性,因此对现实的影响并不立竿见影。

在做了超过40个课题过后,肖健雄感觉这种“发篇论文就没了下文”的学术生活缺乏激情,无法对现实世界造成实实在在的影响,让他难以再获得成就感。

肖健雄想做一件足够大、足够极致的事。与其研究相关的“自动驾驶”,事儿足够大,也足够难,一旦被攻克,将改变整个世界。但学术圈的成果“启发”业界半天,也没有让自动驾驶进步到足够实用的程度,急性子的肖健雄看得着急,决定自己亲自上。也是这种急性子,让他没有选择已经将自动驾驶的研究做得风生水起的谷歌、Uber等大公司。在他看来,这些大体量的公司层级太多,决策成本高,造成其效率低下,动作反而不如初创公司灵活。

同时,肖健雄的潮汕人身份,家族经商的家世,也为他注入了商业的基因——在高中时,肖健雄尝试过做门户网站;大一期间,肖健雄就萌生过开设公司的想法。在做学术研究期间,他并未将对商业的思考抛至一边。对如何建立一家自动驾驶公司,他和业界以及投资界进行了诸多交流,想清楚了商业模式、管理方法,市场容量,以及如何吸引人才等各种问题。

另一方面,自动驾驶随着人工智能的火热,也站上了风口。中国资本在国内不容易找到优秀的项目,把目光转向了硅谷。中国热钱的流入使得华人在硅谷建立自动驾驶公司的融资难度下降了许多,至少,种子轮非常容易拿到。

在各方面因素都趋于成熟后,2016年9月1日,肖健雄的自动驾驶公司AutoX宣告正式成立,产出了第一行代码。

二、AutoX的逆势而行:纯视觉方案实现自动驾驶

承起肖健雄要对现实世界产生影响的厚望,AutoX研发的是全栈自动驾驶系统,包含了感知、规划、控制各个环节。在肖健雄口中,他们所做的事,是为自动驾驶“助力”(国内公司则比较热爱“赋能”一词)。

当然,同样想为自动驾驶“助力”的公司,在硅谷还有一大堆,入局并不算早的AutoX要如何保证自己不在竞争中落败,能真正为自动驾驶出力呢?

肖健雄的答案是,基于纯视觉的解决方案。如果你看过AutoX自动驾驶测试车的路测视频,就会发现在传感器方面,车辆只用了数枚摄像头,就自己跑了起来。

(AutoX基于林肯MKZ的早期自动驾驶测试车)

当前自动驾驶业界的主流观点是,要实现高等级的自动驾驶,激光雷达是必不可少的关键部件。也正因为如此,这些自动驾驶公司的无人车在数据上也是以激光雷达的点云为主,再填充摄像头以及毫米波雷达等传感器的数据,形成车辆对周围环境的感知。

而肖健雄认为,自动驾驶业界对纯视觉的自动驾驶解决方案采用不多,原因是“之前的纯视觉方案做得都不够优秀。纯视觉方案的能力被低估了。”肖健雄想成为这个破局者。

但让业界怀疑纯视觉方案的理由又是切实存在的——强光环境、雨雪天与夜间,视觉识别的准确率会大打折扣。曾经轰动一时的特斯拉自动驾驶致死案,正是因为视觉识别出错,未能判别出前车。

如何解决这个问题?多传感器的方案其实是在硬件上做文章,通过多种类别的传感器数据形成安全冗余。AutoX的解决办法则是增强软件的鲁棒性(robust)。对于视觉识别系统来说,雨雪天等复杂气象条件,是增加了识别过程中的“噪声”(noise),通过对软件算法进行优化,可以滤除这些噪声,使视觉识别的结果满足安全要求。

在这个过程中,曾经做过的学术研究在技术上对肖健雄形成了不少助益。但对他来说,更大的意义在于学术训练让他知道如何寻找开创性的方法解决问题。在软件系统的频繁迭代下,越来越多的非典型场景被AutoX攻克。

从今年三月AutoX展示的路测视频来看,在开放道路+复杂天气(阴雨、夜间)条件下,其测试车运行流畅。此前,福特与硅谷自动驾驶初创Drive.ai也前后放出了在各种“杀手场景”下的路试视频,同样也表现不错。但需要指出的是,他们的技术路线都是多传感器融合。


(图中四个测试场景分别为:左上:晴天的主干道;右上:夜间高速;左下:小雨天盘山路;右下:多云夜间主干道)

在成本上,纯视觉的解决方案在成本上相对于多传感器融合是占有巨大优势的——一枚摄像头价格可以达到数十美元,而目前一台激光雷达,至少也需要数千美元。AutoX的纯视觉方案可以根据具体的功能需求和车型配置摄像头的数量,不过最多也是在十个左右。


(AutoX测试车上的摄像头)

因此,若能在环境感知上和多传感器融合方案达到同样效果,基于摄像头的纯视觉方案在自动驾驶业内的市场竞争力是显而易见的。

不过,肖健雄也非常坦诚地表示,纯视觉方案是AutoX的着力切入点,并不代表着他们排斥多传感器融合的技术路径。在强调安全性的汽车行业,如果多搭载一类传感器就能使得最终的安全性上升一分,那也是值得采用的。在AutoX现有的自动驾驶系统中,也提供了接口,能够接入其他传感器的感知数据,在多种数据的基础上输出决策结果。

三、已获加州路测牌照 L3技术3年后量产

作为创业公司,为了集中力量进行技术突破,AutoX选择了纯软件方向,意图做自动驾驶软件系统。

目前,AutoX拥有6台测试车。最早公开亮相的,正是上文出现的,基于林肯MKZ的改装车。以这款车为自动驾驶车辆平台的主要原因,是提供车辆的AutonomousStuff公司已经在硬件层面上对其进行了较为完整的改装,无需AutoX再花费过多时间。自动驾驶的竞赛中,时间宝贵。

靠着这6台测试车,AutoX已经累积起了几千英里的路测里程。这个数目并不多,主要原因是在17年年初,AutoX才拿到了加州车管局颁发的自动驾驶路测牌照,但考虑到AutoX去年9月才正式开始运行,这已经是进步神速了。


(加州DMV公布的拥有自动驾驶测试资格的公司名录)

快速拿牌的背后,是AutoX一支20余人的技术队伍。其中60%的人,负责自动驾驶感知方面的研发,另外40%,则着力规划与控制。

其实,一开始公司只有肖健雄一个人。但他的学术背景在吸纳人才方面很快发挥了作用。

由于自动驾驶是一个高技术行业,因此对学界人才的要求十分旺盛。而肖健雄在学界常年耕耘,不仅取得了丰硕的学术成果,还积累下广泛人脉;另外,在肖健雄的影响下,AutoX的公司风格比较务实,讲求技术与工程能力,这又与学术圈的气质相投。基于这些原因,AutoX的技术人才多来自美国各顶尖名校。

不过出乎车东西意料的是,那块让不少自动驾驶公司如获至宝的DMV路测牌照,在肖健雄眼里,只是一张单纯的许可证而已。真正有价值的,还在于拿到牌照之后进行的测试工作本身。

在沟通中,车东西发现学术生涯确实给肖健雄留下了烙印——有一份东西说一分话,不太擅长做概念包装。其实Nvidia也是AutoX合作伙伴之一,Nvidia CEO黄仁勋还试乘过他们的测试车。但肖健雄认为,产品没真正落地之前,这些都没什么可说。

在朝向完全无人驾驶的研发上,肖健雄透露,他们的进度是50%,之所以表现得如此保守,是因为自动驾驶在处理大部分常规场景后,要解决余下的特殊情况需要耗费大量的时间和精力——那句流传甚广的“1%的代码解决99%的问题,99%的代码解决1%的问题”虽有夸大,但也不乏道理。

在产品上,AutoX并不打算一步到位实现完全自动驾驶,而是循序渐进。AutoX的首批正式产品会是ADAS,而到2020年左右则可以实现其L3技术的大规模量产应用。

四、绕过Tier1 向整车厂卖技术

那么,AutoX最终要如何盈利?

AutoX的定位与被收购前的Mobileye类似,准备做一个技术方案提供商,将视觉模块卖给整车厂,同时也在积极接洽物流公司。

但有一个问题在于,整车厂由于需要对自动驾驶车辆负责,因此往往会选择更保险的大型Tier1的技术方案。如果初创公司不和Tier1站成一队,那么很难直接将技术卖给车厂,除非直接被车厂收购,融入其体系中。那AutoX要如何在这个夹缝中保持独立?

肖健雄认为,自动驾驶对整车厂来说,既是一个挑战,也是一个机遇。

挑战在于,如果在自动驾驶竞争中掉队了,那么以后可能就会被挤出市场;而机遇则是,在这一波自动驾驶的技术浪潮下,整车厂与Tier1这一对冤家会有一场博弈:传统上Tier1由于掌握了汽车制造的众多核心技术,因此在与整车厂的关系中,处在更加强势的位置。自动驾驶兴起后,整车厂对这一颠覆性技术的追逐,也有利于提高自身在产业中的地位,改善“Tier1有啥,整车厂就用啥”的情况。

AutoX是借着整车厂对自动驾驶的渴望,通过自身在AI、软件层面的优势,向他们提供外部的技术支持。

目前,AutoX与数家整车厂展开了合作。AutoX是准备绕过Tier1,直接成为整车厂的自动驾驶软件供应商。

对于业内另一种比较流行的模式——运营自动驾驶出行车队,AutoX则还没有考虑过。肖健雄的理由是,要实现真正意义上的完全自动驾驶,至少还需要十年。在此之前,这一模式是无法盈利的。谷歌、Uber等大公司或许还能撑住。但对于初创公司来说,难以有足够强劲的其他业务来支撑这一模式,很难扛过10年。

毕竟,AutoX这样的初创,现在仍然是靠着融资存活的。去年,肖健雄在华人背景风投丹华资本的支持下成立了AutoX,在测试车队和技术团队都扩张过后,他们正在准备新一轮融资。

此前,车东西盘点了众多在硅谷的华人背景自动驾驶公司(特写:硅谷自动驾驶淘金热背后的华人江湖)。肖健雄则感觉,资本热也隐隐吹起了自动驾驶行业的泡沫。中国资金涌入的一大好处是,华人更容易在硅谷建立公司了;当然这也不是没有坏处,当钱太容易拿的时候,创业门槛降低,各方人才便四处跳槽、创业,但其中的大部分,都是没有能力和耐心撑到成功的那一刻。从这个角度来说,对整个自动驾驶的发展,研发力量其实是被分散了。

肖健雄称,2-3年内,自动驾驶行业就会开始洗牌,C轮融资,将成为大多自动驾驶公司的一个槛。

结语:独辟蹊径的学院派

在与肖健雄近两小时的交流中,车东西发现,肖健雄的语言以及对在公司发展的规划上,都具有学院派风格——在诸如产品进度、量产时间等问题上,给出的答案都比较务实,不放卫星;对一些显然可以作为宣传素材、提高公司关注度的事件,他则认为“PR没意思”。

这种直接而低调的性格作用于AutoX的对外形象,则是这家自动驾驶公司在建立初期一直保持沉默,然而一亮相就直接放出了场景难度不小的路测视频。

总的来说,AutoX是准备靠深度学习支持的纯视觉自动驾驶方案,走一条差异化竞争的道路。目前,采用该技术路线的公司,能够产出的仍是ADAS的能力。如果能够证明纯视觉方案能够实现高阶自动驾驶,AutoX将脱颖而出。

肖健雄能否让AutoX成为那条搅动行业的鲶鱼?到2020年(或者肖健雄所说的C轮),自会有答案。不过,在普林斯顿任教时,肖健雄的外号是Professor X——超级英雄神秘博士。

在智东西公众号回复“自动驾驶”,获取车东西系列好文和智能出行45篇PDF下载。



延伸阅读

点击下方图片直接阅读


往期回顾

硬创先锋(2017)

共享经济

Hi电 | 云冲吧

人工智能&大数据

先声互联

康夫子 异构智能 医拍智能 彩云AI 神策数据

竹间智能 | 深鉴科技 | 钢铁侠科技 | 蓦然认知 | 达闼科技

VR/AR

RealMax | ObEN | 所思科技

汽车

速腾聚创 Vector.ai | 智行者

WayRay 游侠汽车 | EZZY | 开云汽车

聚焦特写

共享经济

共享充电宝真相:惨不忍睹

共享电动车卷土重来

失控的共享单车

企业观察

李彦宏的24门客:离开百度,野蛮生长

出行教父李斌和他的隐秘帝国

智能快递柜为何陷入困境?

汽车智能后视镜的地下江湖

易到的生死危局

VR寒冬论言过其实

滴滴快车之死

百度大清洗

陆奇上任百度的51天 连烧六把火

微软亚洲研究院英雄谱



登录查看更多
0

相关内容

AutoX是中国RoboTaxi的领跑者,致力于打造无人驾驶核心大脑的软硬件一体化系统。是中国目前唯一一家实现城市公开道路完全空车无人驾驶RoboTaxi运营的公司,具有国内规模最大的RoboTaxi车队。 AutoX由世界著名计算机视觉和自动驾驶领域专家、普林斯顿大学教授、MIT麻省理工博士肖健雄于2016年9月创立,总部位于深圳,在北京、上海、广州、硅谷、常州均设有研发和运营中心,是中国规模最大的RoboTaxi自动驾驶公司。AutoX产品涵盖L4/L5级别自动驾驶域的全套系统,是目前国内唯一一个具备L4/L5级别域控制器自主研发能力的公司。 2019年AutoX获得了全球第二张加州自动驾驶出租车试运营牌照。2020年AutoX获得了全球第二张加州全无人驾驶牌照,也是中国第一家获得该牌照的公司,许可去掉安全员进行无人驾驶。在美国车辆管理局公布的全球自动驾驶企业测试报告中,AutoX名列全球第三名、中国第一。AutoX也是目前国内唯一一个同时获得深圳、上海、广州等多个一线城市自动驾驶牌照的公司。
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
普林斯顿大学经典书《在线凸优化导论》,178页pdf
专知会员服务
184+阅读 · 2020年2月3日
最新!Yann Lecun 纽约大学Spring2020深度学习课程,附PPT下载
【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程
专知会员服务
82+阅读 · 2019年12月11日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
招募 | 腾讯 AI Lab 招收多名 CV 实习生
AI研习社
7+阅读 · 2019年3月13日
计算机视觉领域的王者与荣耀丨CCF-GAIR 2018
AI研习社
4+阅读 · 2018年6月24日
高二进清华,大二开公司,29岁登上福布斯亚洲领袖人物榜
人工智能机器人联盟
5+阅读 · 2017年11月18日
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Two Stream 3D Semantic Scene Completion
Arxiv
4+阅读 · 2018年7月16日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2017年11月14日
VIP会员
相关论文
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Two Stream 3D Semantic Scene Completion
Arxiv
4+阅读 · 2018年7月16日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2017年11月14日
Top
微信扫码咨询专知VIP会员