新智驾按:本文为AI投研邦「大咖Live」第41讲地平线李星宇带来的关于《向超级中央计算机迈进--智能汽车电子构架变革迎接数字化重塑》的分享实录,会员专享内容,由新智驾整理。李星宇,地平线市场拓展与战略规划副总裁,自动驾驶行业资深专家;前恩智浦(飞思卡尔)汽车电子高级市场经理。
目前,本期分享音频及全文实录已上线,「AI投研邦」会员可进入【AI投研邦】页面免费查看。
以下为分享实录:
日前,全球最大的汽车制造商大众宣布,组建自己的软件部门:数字汽车与服务部(Digital Car&Service),大众CEO迪思在今年的达沃斯世界经济论坛上表示:“在不远的将来,汽车将成为一个软件产品,大众也将会成为一家软件驱动公司”。
在汽车行业向出行服务和智能化转型的大趋势下,新的智能功能和服务需求几乎每个月都需要更新,大众的组织变革表明软件定义汽车已经成为业界共识,传统的分布式汽车电子电气构架(E/EA)越来越难以为继。为了适应行业智能化重塑的大趋势,提升开发效率,一场深刻的构架变革正在酝酿,汽车行业正在沿着当年PC和手机行业走过的路迈向智能时代,这背后将折射出怎样的技术挑战、行业变局与应对措施?本文将进行深入探讨。
以下是本文十个关键结论:
1. 智能汽车E/E构架设计面临四大挑战:功能安全、实时性、带宽瓶颈、算力黑洞。
2. 智能汽车E/E构架四大趋势:计算集中化、软硬件解耦、平台标准化以及功能定制化,商业化落地时间大约在2025年。
3. 智能汽车的新构架将基于中央计算机-层-区的概念构建。
4. 新的E/E构架将使OEM在与领先的Tier1的博弈中重新赢得主动权。
5. OEM可能将只会拥有一个覆盖了所有车型的电动汽车(EV)平台。
6. AI芯片是中央计算机的核心,需要越过安全、成本和性能的临界点。
7. 组织变革是OEM在这场技术革命中面临的最大挑战。
8. 苹果、高通、三星和华为在这场变革的竞争中有先天的基因优势。
9. 智能汽车将是有史以来软硬件开发量最大的单一产品,将诞生新的Wintel。
10. 智能汽车作为移动自主机器的第一形态,将撬动比自身市场大得多的商业价值。
今天,E/E构架设计面临四大挑战:功能安全、实时性、带宽瓶颈、算力黑洞。
1. 在功能复杂度持续提升的情况下满足功能安全的要求,这里的功能安全是广义的,不仅包括ISO26262,还包括SOTIF和RSS。
2. 复杂系统构架下实时性的保证。
3. 爆炸式增长的传感数据造成的带宽瓶颈。
4. 支持持续的软件升级所需要的指数级算力增长。
为此,智能汽车E/E构架正从分布式走向集中式;其终极形态将是超级中央计算机,这其中包括四个关键趋势:计算集中化、软硬件解耦、平台标准化以及功能定制化。
*智能汽车电子电气构架发展趋势
下面我们将进一步论述这几个趋势。
1、计算集中化(Computing centralization):服务导向的系统构架(SOA)将成为主流,为软件提供高性能实时计算平台,在这样一个大的理念下,计算集中化将催生真正的汽车大脑:超级中央计算机。目前各个玩家对这个概念的叫法五花八门,包括车载计算平台、主机(Host)以及服务器(Server)等,但本质都一样。
为了满足ASIL-D功能安全的要求,一台汽车通常需要有两台相同的主机互为备份,目前领先的Tier1如安波福、大陆等都使用这样的理念。
伴随着计算集中化,产生了一个新的概念:区控制(zone control),与目前流行的域控制器概念不同的是,区控制模块没有高级功能决策权,而是完成执行器、传感器、诊断以及传统I/O的连接汇总,类似于PC中的南北桥。
拿军事打个比方,域概念就像是按照职能划分海陆空三军(电源域、底盘域、娱乐域、安全域),并且有独立的作战权,但不能彼此共享资源,而区概念则是按照战区进行组织划分,与中央计算机形成了联合作战司令部+战区的概念,协同性和执行效率将得到质的飞跃。
在这样的构架下,决策通常都是由中央计算机来发出,但是也有例外,比如AEB紧急制动的功能,是最重要的ADAS功能,一旦前向智能传感器发现前方有障碍而且即将发生碰撞,可以不经中央计算机决策指令,直接启动执行机构进行刹车,或者在两台中央计算机都出现故障的时候接管刹车执行器,从而提供更高的安全冗余。
如果我们对照人的决策机制,会发现有高度类似的情况:假如我们在野外突然碰到一头老虎,身体的第一反应是僵住不动,这个决策并不是来自大脑的高级理性系统(即皮质),而是来自非常原始的大脑边缘系统(哺乳动物都有),它在紧急情况下会切断大脑对躯干的控制,自动接管以保证能够在瞬间完成必须的生存反应。手碰到烫的东西立马缩回去也是一样的决策机制,这样的例子不胜枚举。
在未来,OEM交付的汽车将不是一个功能固化的产品,而是一个持续进化的机器人,在汽车整个生命周期内,硬件平台需要持续支持软件迭代升级,这意味着,我们必须打造一个开放的、工具链完善的、拥有强大算力保障的计算平台,提供高达1000TOPS的算力,为各种软件功能提供充足的算力储备。
目前业界还没有一款处理器可以满足如此高的算力需求,并且不同的处理器也有不同的性能维度,从实践角度看,需要一个非常灵活、有弹性的主机构架来应对。这里面有三个要求:可扩展、可配置、模块化。一台典型的主机使用PCI-e作为主干局域网(Backbone),提供很多卡槽,可以连接各种加速器(搭载GPU、FPGA、视觉ASIC等芯片的板卡)、安全MCU以及通用SoC。
似曾相识?没错,这个构架跟当年的PC几乎一模一样!
但另一方面,车载中央计算平台对功能安全和实时性要求毫不妥协,在工程实现上,挑战比传统PC/服务器构架要大得多,不能简单照抄。
2、软硬件解耦:SOA构架还将产生硬件抽象层(HAL)的概念,硬件不再被某个功能独享,而是被抽象成软件/服务可以共享的资源。例如,一颗前视摄像头过去可能只为AEB/ACC服务,但现在,任何功能都能调用这颗摄像头。
HAL可以看作支撑软硬件解耦的资源池 。例如,随着SOA构架的发展,一个独立的感知层将会出现,将各个传感器抽象为可被各种应用(无论是人机交互还是ADAS/自动驾驶)调用的资源。而且将原始数据(比如摄像头的每一帧图像)转化为语义信息的工作,相当程度上在区(Zone)上就可以完成,从而减少对骨干网I/O带宽的需求,降低对中央计算机的算力需求,并提升数据处理的实时性。
总结来讲:就是在区上做感知智能,在中央计算机上做认知智能。
今天,功能安全是智能汽车面临的最大挑战之一,如果按照分布式的构架,为每个功能增加独立的安全冗余硬件,简直就是一场成本灾难,并且设计验证也很难收敛,但基于SOA和HAL的新设计构架,可以将所有的硬件资源与应用打通,构架师将有更多的安全路由选择,并且可以扩大安全冗余的资源纵深,充分复用各种硬件资源,为功能安全以经济成本实现开辟一条新的道路。
在供应链管理方面,因为每种资源都有很多独立供应商,OEM将有更多的选择,而不像选择域控制器供应商那样打包购买。这种构架可以让OEM跟领先的Tier1的博弈之间重新赢得主动权。
3、平台标准化:在未来,OEM可能只会开发一个电动汽车平台,覆盖低端车型、中端和高端车型。传统的内燃机受限于机械结构,需要有很多平台,但是EV不一样,底盘设计没有太多限制,所以沿用一个统一的E/E构架成为可能。主机厂将打造自己的硬件平台,并满足三个原则:通用性、标准化以及互操作性。
更重要的原因来自商业考虑:钱!开发这样的智能平台可能需要编写超过3亿行代码,比Windows操作系统要高一个数量级,开发并维护多个平台在经济上不可行。
大众和福特已经在电动汽车领域共享EMB平台,以降低开发成本,随着这一趋势深入发展,很可能会出现类似PC行业的Wintel平台,进而形成一个面向智能汽车的生态系统,这一通用平台将被大多数OEM采用。类似的故事同样曾在手机行业上演,从功能机时代向智能机时代转变的过程中,先后涌现了塞班和安卓这样的通用平台。
4、功能定制化:智能化是未来品牌差异化的核心要素,主要是通过增加软件功能来实现。软件的后部署将是大势所趋,这意味着,多数软件功能将是在汽车出厂之后交付的,软件迭代OTA将是新常态。这一趋势对于出行服务运营商来说尤其重要,各种不同的场景服务需求都需要通过现有车队的大量升级来满足。
*未来的智能汽车将有一个开放的应用平台
来自麦肯锡的分析显示,软件在D级车(或大型乘用车)的整车价值中占10%左右,预计将以每年11%的速度增长,到2030年将占整车内容的30%。
*麦肯锡:《软件和整车电子构架正重新定义汽车行业》
总体来看,这场构架变革是全面性的,还包括主干通信网络的重构、信息安全系统、以及虚拟开发验证环境等非常大的话题,这里就不一一讨论了。几乎可以肯定的是,智能汽车是IT史上软硬件开发量最大的单一产品。
*智能汽车所需要的软件代码量远超IT史上任何一个产品 来源: NXP官网
历史不会简单重复,但总会押韵,这体现的是一致的商业和技术逻辑。在PC刚刚出现的七十年代末,PC的种类也是五花八门,处于战国时代,除了开创者Apple的PC,还有Commodore 的PET 2001机、Tandy的TRS-80机、PTC 的 Sol-20机等,这些PC使用的微处理器和操作系统也各不相同,结果是,各个公司不得不自己开发所有的应用,效率和质量都相当糟糕。
1981年,IBM的5150 PC发布,这是一个具有里程碑意义的产品,它首度定义了PC内部各个模块间的技术规格如ISA等,并开放了除BIOS之外的所有技术资料,这一开源技术旋即形成了一个黑洞,牢牢地吸引了绝大部分公司的兴趣。一个生态系统得以迅速形成,PC部件开发商和整机生产商都以该开放技术为基础进行开发,从而形成了PC机事实上的标准。
对于PC这个当时的新兴产业,IBM的通用平台对创新效率的提升是决定性的,它使得兼容性和互操作性成为可能,任何一个单项技术,都有众多的公司在同时开发。表面上,这种开发模式充满了冗余,但并行化开发可以有效规避整个生态系统被卡死在一个节点上的问题,大大提高了生态系统的整体开发成功率。其后的DOS/Windows软件平台则进一步降提升了应用和服务开发者的效率,提升了商业回报的杠杆率。
智能汽车与PC和手机的本质不同在于:它对于安全性和实时性的要求不能有一点妥协,所以在技术上的挑战要大得多,因此通用平台的意义更大,它使得智能汽车行业的协同进化变得更加高效。
面对数字化重塑的浪潮,IBM认为,需要以客户体验为本,持续业务创新,以效率和客户为中心,建立快速的组织和数字化运营模式。
对于OEM来说,这是一次彻底的颠覆,将带来四个方面的巨大变化:
1. 组织变革:将所有汽车功能域进行集成对组织机构的冲击空前;从根本上重塑主机厂的组织构架,从面向功能的组织转向平台型开发组织。
2. 人才:从当前的基于汽车产品的模式转化为基于软件产品的模式;从以机械和硬件人才为主转向以软件人才为主。
3. 行业格局:改变现有的整车厂和供应商之间的生态系统;从塔状(Tier)供应链走向环状合作。
4. 核心技术:重新定义智能化时代的核心技术:计算平台、操作系统和应用软件。Tesla的核心技术布局是芯片和软件,可谓切中要害。
从技术角度看,最大的挑战来自AI边缘计算。
在过去的数年里,我们看到自动驾驶的等级每提高一级,算力差不多要提升一个数量级。如果要实现全自动驾驶,我们需要1000TOPS量级的算力,而人脑的算力大概也是一千个TOPs,所以自动驾驶如果想达到人类的水平,首先要在算力方面达到人类的水平。
这个等级的算力需要AI芯片突破成本、功耗和性能的瓶颈,就必须将处理器构架的创新,与算法和工具链相结合,软硬协同进行设计。脱离算法和工具链,单纯谈芯片的绝对算力是没有实际意义的。
当前的业界存在一个很大的误区,往往会把绝对算力当作衡量AI芯片的主要指标,但我们真正需要的是有效算力,需要从四个维度来衡量:算力的有效利用率,每瓦的有效算力,每美元的有效算力,以及算力转化为AI结果的效能(目标数量,帧率等)。
本质上讲,芯片和构架是手段和载体,软件是目的和灵魂。软硬件一起做,可以让手段和目的高度统一。
只有硬件俯下身来去适配软件的时候,才能够使晶体管所发挥的效能大幅度增加。处理器构架的创新是一个非常高的壁垒,需要对软件有深刻理解。
这样的整体解决方案决定了数据转化为决策/服务的效率和质量,是时代真正呼唤的硬科技。谷歌是这个理念的实践者,TPU的成功已经证明了这一点,在国内,初创公司地平线基于这样的理念,推出了极高效能的征程AI芯片,并即将推出第二代征程芯片。
可以说,未来的智能汽车就是一部移动的超级计算机兼数据中心,而边缘的人工智能处理器是智能汽车竞争的主战场,更是技术制高点。
谷歌是这个理念的实践者,TPU的成功已经证明了这一点,初创公司地平线也基于相同的理念,推出了极高效能的征程AI芯片,并即将推出第二代征程芯片。
边云协同计算是另一个大趋势,车载中央计算机、MEC(多接入边缘计算)以及基于5G的云计算将组成的协同式计算方案,避免车端算力需求的无限增长。
预测未来的最好方法就是去创造它,特斯拉、安波福、GM以及宝马等已经开始实践,我们接下来会分析几个领先者的设计理念和路线图。
(一)安波福
*安波福的中央计算构架定义
安波福将自己的中央计算平台的构架称为智能汽车构架(Smart Vehicle ArchitectureTM ,简称SVA),汽车将成为一个整体计算平台,能够执行复杂的软件功能,就像在服务器上运行那样。这可以让OEM独立于硬件来开发软件功能,并且在不升级硬件的情况下升级软件和安全功能。
如何实现这个构架? 安波福提出了两个关键概念:供电数据中心(Power Data Center,简称PDC) 以及 开放服务器平台(Open Server Platform ,简称OSP)。
供电数据中心(PDC)的理念非常类似于笔记本电脑的基座,一个典型的笔记本电脑的基座有USB、HDMI、SATA、电源插口等一系列接口,可以连接各种我们可能用到的外部设备,基座作为桥梁将外设与笔记本电脑连接起来。
在智能汽车上,PDC将负责连接各种传感器、分布式音响系统以及各种控制器/执行器,为此,PDC将需要有Ethernet、CAN以及LVDS等总线接口。
PDC的另外一个关键作用是为自动驾驶系统提供可靠的备份电源(可以在电源出现故障时,数毫秒内切换到备份电源),同时,它还起到了网关以及各种控制器集成整合的作用(PDC有一个强大的处理器来实现这些功能),从而实现区域控制,简化了中央计算机所要完成的工作。
今天,主流的构架是以功能划分的逻辑域,但是,逻辑域的功能高度分散在不同的物理控制器中,结果是构架非常复杂,在整合、测试以及可扩展性方面面临很大挑战。PDC的出现将外部执行单元与计算隔离,是典型的中央计算机+区控制的实现案例。
开放服务器平台是一个非常灵活通用的计算平台,能够支持图形运算、AI计算、网络处理以及功能安全。类似于我们调用云端的服务器算力做各种应用一样,它支持各种车载应用的算力需求,从后备箱的自动控制,到人机交互,再到自动驾驶。
这个平台不仅将计算的工作集中起来,而且提供了灵活的软件框架和智能的硬件抽象层,从而使得逻辑域成为物理硬件的模拟。这种突破对软件非常友好,因为硬件被整合成了资源,而软件则从对于具体硬件的控制变成了在服务器上调用资源。软硬件解耦,为未来的车载应用创新解锁了几乎是不受限制的想象空间,就好像iPhone开启的应用程序市场模式一样,在未来,各种新的车载功能将可能来自第三方的公司,而非车厂,但车厂将有功能验证和发布流程认证,确保安全性和兼容性。
根据安波福的规划,这种转变是分阶段进行的。2022年将会推出一个混合构架,把PDC整合到传统的车载E/E构架中。到2025年,将实现全开放服务器平台的构架,我们将会看到一个基于服务器构架的计算平台,该平台将整合PDC、安全冗余设计、以及一个标准的的软件开发框架,对于安全应用或非安全应用都保持一致。
安波福认为OEM客户从传统的E/E构架到这一新构架的过渡将会渐进式的,但终局不会有悬念,那就是开放服务器平台。
(二)特斯拉的实践
*特斯拉Model 3的E/E构架
在Model 3的E/E构架中,域控制器的概念被区控制替代,整个构架分为三大模块:第一个是自动驾驶(Autopilot)及娱乐控制模块,相当于中央计算机,第二个是右车身控制器(BCM RH),第三个是左车身控制器(BCM LH)。
Autopilot与娱乐控制模块掌控了所有的摄像头和雷达传感器。在模块内部,Autopilot系统和娱乐系统这两大部分通过CAN和高速串行总线FPD-Link打通。这比起如今娱乐域和安全域老死不相往来的构架设计,明显高了一个层次。实际上,FPD-Link的存在表明,两者之间甚至可以传递视频数据。
自动驾驶及娱乐控制模块Autopilot & Infotainment Control Module虽然是一个模块,但是内部还是分了2个硬件平台和2个系统,最大的变化是将全车摄像头进行了集中的接入和运算,通过Drive PX2计算平台集中整车所需的AI算力。两个系统之间通过CAN和LVDS传送数据,摄像头图像可以由Autopilot系统接入后通过LVDS传给娱乐系统。这一架构让基于车内和车外图像的AI应用开发和更新迭代变得可实现。例如Tesla想在Model 3上升级当下最热的AR Navi功能,也许只需要软件工程师动动手指头就搞定了。
右车身控制器集成了自动泊车、座椅控制、扭矩控制等功能;左车身控制器集成了内部灯光、转向柱控制等。两个车身控制器也都和线控执行单元、转向控制、防抱死制动系统等执行器相连,可以直接操作车辆。在Model 3新的EE架构中,电池管理和充电控制和DCDC、车载充电机、PDU都被集成进一个单一单元,缩减了整车的高压线束成本和装配成本。
通过EE架构的集中化,Tesla将汽车的软件开发内化,将汽车底层硬件标准化和抽象化,此举让Tesla通过软件定义汽车和创新变得更容易。以19年初Tesla发布的Sentry 模式和Dog模式,Twitter用户乔希•阿奇利(Josh Atchley)问马斯克,他能否实现一种“宠物狗模式”功能,即播放音乐,打开空调,屏幕上显示着“我很好,我的主人会回来的”。对此,马斯克只是简单地回答:“可以。”此外,另一位用户也建议将车内温度也显示在屏幕上,马斯克似乎很喜欢这个想法,他在推特上回复说,“正是如此”。Elon Musk简单回复后就可以内部推动执行了,换在以前,Tesla的工程师需要去找相关的供应商逐一问一遍是否愿意接受变更,供应商们或许迫于压力,同意更改,但是需要长达半年的变更周期和天价的设变费用,而这一切假设可能是最理想的。
特斯拉从Autopilot1.0到2.5的进化,都是沿着功能集中化,资源共享化的道路前进,而软件版本已经迭代到V9,则体现了特斯拉软硬件解耦,通过软件定义汽车的实践。对于消费者来说,每一次OTA系统升级都会带来新的体验,就不会感觉到这辆车会过时。最近通过OTA升级发布的“哨兵模式”和“狗狗模式”非常生动地体现了这一点。
(三)宝马
宝马在E/E构架方面的变化清晰地折射出计算集中化的趋势。
*宝马规划的下一代E/E构架
(四)博世
博世的渐进式路线从域的集中化开始演进,终极目标一样是车载中央计算机,并且进一步扩展了与云端配合的分布式计算能力。大陆的发展路径也和博世非常类似。
*博世的渐进式路线
从技术上总结,中央计算机-层-区的概念将建立起智能汽车的新构架。区是局部控制、感知与执行单元,层是按照职能划分的资源池,中央计算机是真正的决策大脑,面向应用/服务,调用各层资源,执行高级决策,由区控制单元执行决策或完成态势感知任务。
对于车载E/E构架来说,中央计算机构架是全新的,但对于PC和手机行业,无论是SOA还是HAL,中央计算机构架都已经是非常成熟的概念。当智能化浪潮从IT行业延伸到汽车的时候,我们看到了相同的故事正在上演,汽车行业的基因正在发生改变。
从这个意义上讲,无论是苹果、英特尔、高通、三星还是华为,他们大举进军汽车行业的逻辑,绝非简单地复制,而是将自身的IT基因与汽车固有的基因进行新的编辑,进化出新物种,并引领计算行业从手机的TOPS时代走向POPS(1000TOPS)时代,在这一过程中,他们有先天的基因优势。
高度变化的需求、智能化的持续演进、车载硬件和软件系统复杂程度的提升对计算构架的可扩展性、易用性、系统可靠性提出了严峻的挑战,各大玩家殊途同归,朝着中央计算机的构架和服务导向的开发理念前进。特斯拉、通用、宝马、安波福、博世、伟世通以及地平线等正在引领这一潮流。
目标往往是清晰的,但通往目标的路径却大相径庭,无论是IT新贵,还是汽车行业老兵,大家都是基于自己的优势积累,从不同的坡,爬同一座山。在这个过程中,对于产品路线图、性能、安全性和成本的拿捏,各家都不尽相同,很难讲哪条路更好,所以无论是大陆和博世的渐进式域融合(domain fusion)路径,还是特斯拉和安波福更激进的实践,都是面向未来的探索,都值得尊重。
从PC到手机,再到机器人,每一代智能设备相比前代,都是十倍体量的增长。智能汽车作为移动自主机器的第一形态,是机器人时代当之无愧的杀手级应用,更是技术旗舰,将催生无数种的移动机器人。正如蒸汽机开启了工业革命时代,手机行业引领了整个移动设备时代一样,智能汽车最终将撬动比自身市场大得多的商业价值。
只有把视野放在在机器人时代宏大的叙事背景下,我们才能看到智能汽车之于这个时代的全部意义。看到趋势并不难,难的是自我革命,谁能更坚决地拥抱这一趋势,谁就能赢得百年汽车行业巨变时代的竞争。
为更深入的解决听众在智能驾驶方面的困惑,「Live」在分享结束后照旧是问答环节,李星宇对「AI投研邦」会员的疑问进行了一一解答。摘录部分如下:
问:从你的观察看,主机厂在向软件发力的过程中,还需解决哪些问题?
李星宇:核心还是人才和组织结构,从面向功能的组织转向平台型开发组织,堪称是涅槃重生。
问:请问软件大规模上车,如何保持开放性和安全性之间的平衡?
李星宇:首先这个问题不可能有一个终极答案,它是一个持续寻找最优解的过程。其次,整个行业从各个维度上,包括法律、监管、开发全流程、认证测试准入等方面都是加固篱笆,其间可能会有各种问题事故,但开放的大趋势是不会变的,我们从过去的历史里,从电力的发展、银行、核电的发展里都看到了相同的脉络。
问:智能汽车向超级中央计算机迈进,是否会像PC和手机行业一样,出现一两家独大的局面?
李星宇:我认为在行业的上游,比如高性能芯片和基础操作系统方面,很有可能是这样的局面。他们有可能占据这场变革的中心位置。
问:智能化大势所趋,主机厂内部、主机厂和一级供应商、软件公司之间的关系和各自的作用和地位会发生什么变化?
李星宇:从简单的层状供应链模式转向协同进化的拼图模式。每一个玩家都需要寻找并定位自己的核心地盘,很难再出现全栈都很强的玩家。
问:如果车载操作系统可以安装第三方软件,安全性这块如何保证?
李星宇:车厂将有非常严格的功能验证和发布流程认证,确保安全性和兼容性。
问:智能汽车的发展推进低于预期,站在二级供应商角度,你觉得智能汽车还面临哪些技术挑战?
李星宇:这是一个用整篇PPT都无法圆满回答的问题。在方法论上,协同进化是解决之道。对与Tier1/OEM来说,不同的Tier2的组合可能是更好选择,所以,你的竞争对手很可能也是你的神助攻。
欢迎在今日头条、天天快报、UC 头条、一点资讯、新浪微博、搜狐号、网易号关注@新智驾。
推荐阅读: