2021 亚马逊云科技 re:Invent 刚刚落下帷幕,许多开发者都在讨论今年亚马逊云科技 re:Invent 的重磅发布。
这并不奇怪,每年亚马逊云科技 re:Invent 都会有数十项新产品、新功能发布,其中一部分,可能代表了日后云计算及整个 IT 界基础设施的发展方向,比如曾经的 Amazon RedShift、Amazon Lambda,前者引导了业内云原生数仓的发展,后者则把无服务器带进了业内开发者的视线。
但今年的亚马逊云科技 re:Invent 有些不一样,除了在产品性能上的常规迭代,更重要的是体现了云计算的服务在概念上的延伸。最为典型的,便是 Amazon IoT TwinMaker 与 Amazon IoT FleetWise。
据官方介绍,Amazon IoT TwinMaker 是一款可以让开发人员更加轻松、快捷地创建现实世界的数字孪生,如楼宇、工厂、工业设备和生产线。用户可以通过 Amazon IoT TwinMaker,使用数字孪生来构建反映现实世界的应用程序,提高运营效率并减少停机时间。
数字孪生是物理系统的虚拟映射,可根据其所代表的现实世界对象的结构、状态和行为定期更新。Amazon IoT TwinMaker 让开发人员可以轻松汇集来自多个来源(如设备传感器、摄像机和业务应用程序)的数据,并将这些数据结合起来创建一个知识图谱,对现实世界环境进行建模。
数字孪生技术最早是用于航空航天飞行器的健康维护与保障,属于冷门技术。但随着“元宇宙”概念的兴起,数字孪生技术越来越为人所熟知,因为数字孪生的本质特征是在信息世界对物理世界进行等价映射,因此成为元宇宙概念的重要支撑技术之一,尤其是工业元宇宙,应用更是广泛。
亚马逊云科技 re:Invent 这次发布 Amazon IoT TwinMaker 可以说,既与元宇宙相关,也与工业互联网有关。从前,云计算的服务范围,聚焦在互联网产业,面向所谓的传统产业,主要提供转型服务。但现在,云计算的服务外延正在飞速扩展,通过元宇宙这座桥,已将范畴扩大至整个物理世界的虚拟化映射。
与此紧密相关的是 Amazon IoT FleetWise。Amazon IoT FleetWise 使汽车制造商可以轻松地收集和管理汽车中任何格式的数据(无论品牌、车型或配置),并将数据格式标准化,方便在云上轻松进行数据分析。当数据进入云端后,汽车制造商就可以将数据应用于车辆的远程诊断程序,分析车队的健康状况,帮助汽车制造商预防潜在的召回或安全问题,或通过数据分析和机器学习来改进自动驾驶和高级辅助驾驶等技术。
如果说 Amazon IoT TwinMaker 提供的是从现实世界到虚拟世界的映射服务,那么 Amazon IoT FleetWise 就是聚焦车联网领域,解决的是车联网长期以来的发展问题。车联网概念最早出现于 20 世纪 60 年代,但 60 年来,一直有点“瘸腿发展”的意思——大部分人对车联网的理解是,在车内提供网络服务,而不是将车辆数据上传分析。
直到 2012 年特斯拉 Model S 出世,才把车联网作为必选功能,纳入汽车生产制造的流水线里。现在 Amazon IoT FleetWise 发布,把车联网相关服务全面引上云端。
Amazon IoT FleetWise 的一个重要特征是,可以在云中构建车辆的虚拟表示,并应用通用数据格式来构建和标记车辆属性、传感器和信号。Amazon IoT FleetWise 使用车辆信号规范 (VSS) 对车辆建模进行标准化,以便“燃料压力”等信号始终表示为燃料压力,并以每平方英寸磅力 (PSI) 和千帕 (kPa) 为单位进行测量。车辆建模后,上传标准 CAN 数据库 (DBC) 或 AUTOSAR XML (ARXML) 文件,以便 Amazon IoT FleetWise 可以读取通过车辆控制器局域网总线 (CAN 总线) 发送的独特的专有数据信号。
看懂了吧,其实 Amazon IoT TwinMaker 和 Amazon IoT FleetWise 的底层理念如出一辙,都是在云端构建虚拟映射,不过一个是针对工业领域,一个是针对汽车行业。可以说,这个世界正在虚拟化,同时也正在云化。
如果说 Amazon IoT TwinMaker 和 Amazon IoT FleetWise 体现了云服务在横向上的概念延伸,那么 Amazon SageMaker Canvas 则是在纵向上的概念延伸。
大家都知道 Amazon SageMaker ,作为一个已发布四年的全托管机器学习服务。Amazon SageMaker 为开发者提供了一套完备的“中央厨房”,使用 Amazon SageMaker 开发者只需准备好“食材”(数据)就可以直接开始做菜(训练模型),大大提升了开发人员和数据科学家构建、训练和部署机器学习模型的效率,开启了全新的智能时代。
但 AI 领域长期受到人才短缺问题的限制,而 AI 的应用领域正在增多,机器学习服务的门槛需要进一步降低。亚马逊云科技此次发布 Amazon SageMaker Canvas 的目的即在于此 —— 用无代码理念构建机器学习模型,做模型预测,保证在脱离数据工程团队的情况下,依然可以提供服务。它利用与 Amazon SageMaker 相同的技术自动清理和组合您的数据,在幕后创建数百个模型,选择性能最佳的模型,并生成新的单个或批量预测。支持二元分类、多类分类、数值回归、时间序列预测等多种问题类型。
此前业内还有许多关于低代码、无代码的争议,但现在看来,这不是概念之争,而是产业内有确实的需要。Amazon SageMaker Canvas 的发布即是验证了这一情况。
站在整个 AI 的宏观层面而言,无论是基于 AI 提供的预测服务还是分析服务,也脱离了单纯对更高级别人工智能的追求,而兼顾 AI 能力对产业的赋能。这是云计算对服务理念的进一步扩大和贯彻。
而在这种情况下, Amazon Private 5G 的发布,自然也被许多人所关注,因为它是支撑服务外扩的重要和必要尝试。可以说,Amazon Private 5G 是本次 re:Invent 最重要的发布之一。
在移动端,我们早就用上了 5G 通信服务,但企业需要的是专有 5G 服务网络。Amazon Private 5G 可自动设置和部署网络,并按需扩展容量以支持更多设备和网络流量。亚马逊云科技 EC2 副总裁 David Brown 说:“借助亚马逊云科技私有 5G,我们将混合基础设施扩展到客户的 5G 网络,以简化、快速且廉价地建立私有 5G 网络。客户可以从小规模开始,按需扩展,按需付费,并从亚马逊云科技控制台监控和管理他们的网络。”
而 Amazon Private 5G 也重点服务了以工业 4.0 为主的庞大传感器和端侧设备集群,前文提到的工业元宇宙、车联网自然也在同一序列。
全球最大的非上市公司——美国科氏公司工业集团(Koch)已经和亚马逊云科技就 Amazon Private 5G 达成了合作,而科氏企业集团的核心是石油与化工,也是亚马逊云科技比较有代表性的服务案例。
当然,不管是 Amazon IoT TwinMaker 等 IoT 服务,还是 Amazon Private 5G,依靠的还是底层实例中的芯片性能。在今年的云栖大会上,阿里巴巴旗下半导体公司平头哥发布自研云芯片倚天 710 并宣布其性能超过 Amazon Graviton2 20%。
此次 re:Invnet 上发布的 Amazon Graviton3 官宣为科学计算、机器学习和媒体编码工作负载提供 2 倍的浮点运算性能,为加密工作负载速度提升 2 倍,为机器学习工作负载提供 3 倍的性能。在相同性能下,与同类型 Amazon EC2 实例对比,可节省高达 60% 的能源消耗。
新 Amazon C7g 实例由 Amazon Graviton3 处理器支持,与由 Amazon Graviton2 处理器支持的当前一代 Amazon C6g 实例相比,性能提高 25%。这样一来,整个云计算产业的算力水平再次集体拉升,并回到同一水平。
当然,Amazon Graviton3 属于通用芯片,专用芯片也更新了。亚马逊云科技公布,由亚马逊第二款机器学习芯片 Amazon Trainium 支持的新 Amazon Trn1 实例,将为在云中为自然语言处理 (NLP)、计算机视觉、搜索、推荐、排名等用例训练深度学习模型提供最佳的性价比,与 P4d 实例相比,通过 Amazon Trn1 实例训练深度学习模型的成本降低达到 40%。
Amazon Nitro System 芯片也发布了新品。Amazon Nitro 可以说是个超级黑科技,准确来讲它是一个套架构,可以将服务器提供给用户的资源最大化,减少虚拟化损耗。所谓“虚拟化损耗”,就是以往为了维护服务其正常运行,在网络、存储、管理等系统功能方面做出的必然开销,这种开销要占到服务器总体性能的三成。Nitro 架构就是通过定制硬件,关注这三成的性能问题。
而这次发布的 Amazon Nitro System 芯片,主要是支持 Amazon EC2 Instance 底层管理平台,可以替 CPU 分担工作负载。通用芯片、推理专用芯片、 Amazon EC2 支持芯片,这次发布的是整整齐齐。Amazon Nitro SSDs 的 Im4gn/Is4gen/ I4i 实例提供 30 TB 的 NVMe 存储,与上一代 I3 实例相比,I/O 延迟降低了 60%,延迟可变性降低了 75%。
当然,除了在网和端层面的服务能力扩展,此次在 Serverless 层面的更新也值得注意。
业内都知道 Amazon Lambda 开启了 Serverless 的时代,但真正获得业内的广泛赞同和跟随,还是在 2019 年。这次 亚马逊云科技 re:Invent ,亚马逊云科技一口气发布了四个核心产品的 Serverless 版本:Amazon Redshift Serverless、Amazon EMR Serverless、Amazon MSK Serverless 和Amazon Kinesis data streams on-demand。
Amazon Redshift 我们已经提过,是最早的云原生数仓;Amazon EMR 则是亚马逊云科技提供的 Hadoop 托管服务;Amazon MSK 是 Kafka 托管服务;而 Amazon Kinesis data streams on-demand 则是流式数据处理平台。
而这些服务的 Serverless 版本则是让使用者单击几下即可运行使用这些框架构建的应用程序,而无需配置、优化或保护集群。
云端大数据架构,因为亚马逊云科技这些 Serverless 版本服务的更新,其门槛正在飞速降低。以往像智能湖仓这种架构的搭建,让架构师、工程师很头疼,而现如今,工程师的工作正在变成单纯的调参 —— Serverless 对产业生态的改变几乎是永久性的。
从 2021 亚马逊云科技 re:Invent 及今年各云计算大会的发布情况看,云计算领域的产品更迭,一是注重底层基础算力的升级,这属于硬核实力的比拼;二则是注重服务外沿的扩展,如何理解云、网、端三个角色,并提供尽量通用的公有云服务,成为关键。元宇宙则是当下新兴起的概念,为整体的技术发展方向提供了新的想法和方向,值得我们特别思考。
常有人说 C 语言过时了,真的吗?
最近不少朋友面试大厂,就被问到组成原理、操作系统相关问题(毕竟越是大厂,越注重基本功),而搞懂这些的基础就是 C 语言。不夸张地说,C 语言的技术债,迟早要还。推荐 PayPal 技术专家「于航」的新专栏《深入 C 语言》,带你掌握 C 程序从编写到运行的全链路法则,体系化一次性吃透 C 语言。原价 129 元,新人专享 59 元,扫码试读👇🏻。
点个在看少个 bug 👇