2021 亚马逊云科技 re:Invent 结束了,在数十项发布里,哪个产品最为重要,对云计算行业影响最大?
可能会有不少人把票投给 Amazon Graviton3。这不仅因为“自研芯片”这个概念在当下成为了“硬核实力”的象征、大众喜闻乐见的话题,也不仅因为芯片代表了云服务最基础的能力,更是因为 Amazon Graviton3 的发布,实实在在地影响了整个产业的格局,在多个领域起到了一锤定音的效果。
新任亚马逊云科技首席执行官 Adam Selipsky 在 re:Invent 上援引分析师的估算:目前云上支出只占整个 IT 支出的 5% 到 15%,未来将有大量的工作负载迁移到云。同时,在此前的各类云计算大会上,来自气象领域、生命科学领域的专家也曾纷纷表示,要进行科学研究,做更精准的建模,需要庞大的算力支撑。因此,在当下阶段,产业对云计算的核心需求仍然是算力。
这就意味着,整个行业对云端算力的需求始终在增长,芯片始终是云计算的核心能力以及最大底牌,芯片的性能直接从根本上决定了云行业未来的发展。
那么这次亚马逊云科技发布的 Amazon Graviton3,牌面有多大呢?我们先将目前所有已知参数做个汇总:
Amazon Graviton3 采用 5nm 工艺,64 核,集成了 550 亿晶体管,主频 2.6 Ghz,支持 bfloat16 (为深度学习而优化的新数字格式),PCIe 5.0。与 Amazon Graviton2 相比,Amazon Graviton3 处理器支持为科学计算、机器学习和媒体编码工作负载提供高达 2 倍的浮点运算性能,为加密工作负载速度提升高达 2 倍,为机器学习工作负载提供高达 3 倍的性能。
Amazon Graviton3 处理器的能效也更高,在相同性能下,与同类型基于 x86 的实例对比,可节省高达 60% 的能源消耗。
由 Amazon Graviton3 处理器支持的 Amazon C7g 实例与由 Amazon Graviton2 处理器支持的当前一代 C6g 实例相比,可将计算密集型工作负载性能提高多达 25%,网络带宽也高出 20%。C7g 实例支持 Elastic Fabric Adapter (EFA),允许应用程序直接与网络接口卡通信,提供更低且更一致的延迟,提高需要大规模并行处理(如 HPC 和视频编码)的应用程序的性能。
Amazon C7g 实例同时是云中第一个采用最新 DDR5 内存的实例,与基于 Amazon Graviton2 的实例相比,它提高了 50% 的内存带宽,达到 300 GB/sec,从而提高了科学计算等内存密集型应用的性能。
就整体性能来看,即便其性能参数还没有全部公布,在云计算行业也属于顶流了,将 Amazon Graviton3 看做“底牌”并不过分,它有推动行业前进的实力。
那么将 Amazon Graviton3 视作整个云计算行业在 2021 芯片领域的代表是否合适呢?至少在现阶段,可能是十分恰当的,数据是最好的答案。
据 Garnter 统计数据显示,2020 年,亚马逊云科技以 40.8% 的市场份额大幅领先、位居全球第一,第二名的市场份额还不到亚马逊云科技的一半。今年 7 月 30 日,亚马逊云科技发布了 Q2 财报,显示其季度收入为 148 亿美元,过去十二个月收入为 527 亿美元,增速 37%,增速增长了 9%。
这样的份额和增速,让亚马逊云科技在全球云计算市场形成的势能极大,其自研芯片发布的影响也是相当巨大的。我们可以通过其官方合作案例来具象化这种影响:
尽管 Amazon C7g 实例还只有预览版,但 Twitter 平台主管 Nick Tornow 已经表示支持:“我们发现基于 Amazon Graviton3 处理器的 C7g 实例与基于 Amazon Graviton2 处理器的 C6g 实例相比,可将性能提高 20%-80%,同时还将尾部延迟减少多达 35%。我们非常高兴并期待利用基于 Amazon Graviton3 处理器的实例获得更好的性价比。”
要知道,2020 Q2,Twitter 的日活可是高达 1.86 亿。亚马逊云科技展示的客户案例还有许多,个个是重量级:
一级方程式(F1)赛车首席技术官 Pat Symonds 表示:“基于 Amazon Graviton3 的实例在性价比方面的优越表现,我们期待它成为运行所有 CFD 工作负载的最佳选择。”
Epic Games 高级工程总监 Mark Imbriaco 表示:“我们的测试表明,它们(Amazon Graviton3)甚至适用于要求最严苛、延迟敏感度最高的工作负载,同时提供卓越的性价比,提升了《堡垒之夜》和任何基于虚拟引擎创造的游戏体验。”
更为重要的是,尽管还不确定 Amazon Graviton3 是基于 Arm Neoverse N2 还是 V1,但性能始终是有保障的,N2、V1 分别代表了最高单芯片性能和最高单线程性能,Arm 对 N 系列的 PPA 特征定义是“性能、功率、面积得到了同等的考量”,对 V 系列的定义是“突破性能极限”,哪种都好,都是 Arm 在摘掉“只能在功耗上做文章”后的翻身仗。
而 Arm 能有这场翻身仗,一个离不开苹果的 M1,另一个就主要靠亚马逊云科技的 Amazon Graviton 系列。M1 主要引导了行业对个人 PC 领域状况的关注,而 Arm 在企业服务市场的发力,甚至还在个人 PC 之前,这也是 Amazon Graviton 系列影响力的证明。
就在 Amazon Graviton3 的背后,其实也反映着,Arm 在芯片级的技术创新,是云计算能力长期发展的源动力。今年的 2021 亚马逊云科技 re:Invent ,亚马逊云科技发布了 Amazon IoT TwinMaker、Amazon IoT FleetWise、Amazon Private 5G,云边端一体战略、5G 战略都已经落地,而 Arm 端云同构、低功耗、高效能和轻量化的特点,恰好适应云行业整体战略的走向。
同时 Arm 架构下的芯片性价比高于 x86,Amazon C7g 实例明年在市场的全面展开,会把这一判断变成实实在在的商业逻辑。
除亚马逊云科技外,国外几个主要云厂商的云服务实例现阶段是基于 x86 架构,但早前都有传闻放出,考虑基于 Arm 架构自研芯片。国内云厂商则早已拥抱 Arm,生态建设进展飞快。
Arm 生态唯一的隐忧来自于英伟达的 400 亿收购,但来自英国、欧盟、美国等国家和地区监管机构的质疑,让收购处于停滞阶段。
至少在未来几年,Arm 生态的繁荣是不可避免的,生态内以亚马逊云科技为代表的云厂商们,也将“底层”无忧。
芯片性能能否保持高速增长,是否符合摩尔定律,这自然是芯片行业关注的焦点。但芯片功耗之于云计算产业,也是越来越重要,不能够忽视。
从短期目标来看,功耗直接影响成本,成本越低利润越高,越适合大型公有云厂商集中采用。同时,不断有调研机构给出数据,未来过半的数据将集中在端侧,物联网设备对功耗的要求也会越来越严格。
从长期目标来看,对碳排放的控制已成全球共识,未来对芯片功耗、数据中心能耗的要求只会收紧,不会放宽。
可以说,基于 Arm 架构的 Amazon Graviton3 是符合行业的短期利益和长期利益的。2022 年年初,x86 架构下的芯片很可能推陈出新,核心数量也很可能超越 64 ,但在以上种种维度因素的综合考量下,能否对抗 Amazon Graviton3,就是未知数了。