ZStack + 神龙服务器:弹性裸金属开创企业私有云新纪元

2020 年 8 月 6 日 InfoQ

2020 年,“新基建”的产业东风吹遍大江南北,为中国高科技领域发展注入了一剂强心针。新基建规划的关注重点之一就是以云计算、人工智能等为代表的高新技术产业基础设施的建设和推广,国家将它们作为赋能经济快速稳定发展的重要手段。

在国家政策和市场需求的推动下,中国云计算市场迎来一波强劲增长,预计到 2022 年中国云计算市场将突破 2900 亿元规模,是 2018 年的 3 倍之多,复合增长率高达 32%,全球占比提升至 15%,在全球遥遥领先。云计算产业的火热也必将带动私有云市场的爆发,IDC 预计 2023 年中国将成为全球规模最大的私有云市场,市场规模将超过 1500 亿元,全球占比将高达 25%。值得关注的是,由 ZStack 推出的基于阿里云神龙架构的弹性裸金属云,会成为私有云市场高速成长过程中的重要推动力,有望帮助大批传统企业迈入云计算的大门,成为新基建时代一颗耀眼的明星。

1 从虚拟化到弹性裸金属:云计算技术发展三部曲

云计算的理念最早可追溯至上世纪 90 年代。到了 21 世纪的第二个十年,曾经一度不被看好的云计算模式才终于迎来了春天,在全球范围开始了高速发展。传统云计算模式以虚拟化技术为核心,提升硬件利用率的同时也有效降低了成本,赢得了越来越多的企业青睐。

然而,随着企业在数字化转型之路上越走越远,传统云计算模式的弊端也愈加凸显。2016 年,神威太湖之光超算登顶 Top500 的喜讯,极大刺激了国内高性能计算市场的需求,众多政企单位都开始尝试部署自己的高性能计算平台,希望在科学和研发等领域抢占先机。但在平台部署的过程中这些单位发现,“一台服务器运行多个操作系统”的虚拟化技术带来的额外开销,会显著影响平台的性能指标,不仅不能降低、反而抬高了平台的整体使用成本。

另一方面,由于企业对云端部署的安全性愈加重视,“与其他客户共用物理机”的虚拟化模式也引发了他们的深切担忧。为保障信息安全,企业更希望在云端独占物理机,一台机器只运行一个 OS,避免数据泄漏的风险。此外,独占物理机还能免疫虚拟机带来的性能波动影响,用户的操作系统实例不需要和同台机器上其他实例抢占计算资源,计算能力可以保持长期稳定。

在此背景下,“裸金属”解决方案重新回到产业舞台,受到行业普遍关注。

第一代裸金属:昙花一现

早在 2010 年,裸金属的概念就已经在业内浮现。第一代裸金属的核心思想是通过 ISO 或磁盘镜像在物理机上安装操作系统,让每一台物理机只运行一个操作系统,再通过统一的管理平台提供云端服务。

第一代裸金属虽然解决了传统的虚拟化云端模式中计算开销大、安全隐患、性能波动等缺陷,但其自身的问题却更加严重。由于物理机的操作系统安装复杂,一代裸金属使用非常不灵活,安装一个 ISO 需要 15-30 分钟,销毁一台服务器还需要对磁盘执行写 0 操作,这个耗时更久;令客户难以接受的还有,一代裸金属在网络和存储端毫无弹性,比如不能通过隔离创建虚拟化网络;更麻烦的是,一代裸金属的网络配置和网络硬件设备深度绑定,管理软件都是针对少数硬件而定制的,网络编程能力十分有限。而且一代裸金属无法使用本地盘以外的存储区域,云平台应有的便利性,瘦克隆、快照、增量灾备这些云端用户早已习惯的功能统统无法使用,维护管理都非常麻烦。

因为这些缺陷,一代裸金属很快就被市场无情抛弃,从诞生到消亡都没有掀起多大浪花,更谈不上对传统云计算模式有什么冲击了。

弹性裸金属:两全其美的真正变革

一代裸金属昙花一现,但传统云计算模式存在的问题并没有得到有效解决。与此同时,私有云的兴起让“一台物理机多个租户”的虚拟化技术更显得不合时宜——企业搭建的私有云通常只负责为企业内部用户提供服务,而企业用户大都习惯独占物理机,“一台机器一个用途”,仅在私有云中照搬虚拟化模式是很难满足企业需求的。

换句话说,私有云用户想要的是两全其美的方案:既具备裸金属方案的物理机独占特性,享受超低的开销与稳定的性能输出,又能像云平台那样便于维护管理,尤其是在网络和存储方面具有虚拟化的“隔离”功能,可以在物理连线上按需构建拓扑,并拥有足够的弹性和灵活度。

所谓时势造英雄,在用户的迫切需求推动之下,ZStack 和阿里云神龙团队在一代裸金属方案的基础上引入重大变革,创新研发了基于神龙架构的弹性裸金属云。

弹性裸金属与传统裸金属的最大区别,就是能否使用云平台的全部功能。——ZStack 创始人 &CEO 张鑫

相比第一代裸金属,基于神龙架构的弹性裸金属云具备完整的云平台特性和优势,不仅能快速创建和销毁计算实例,轻松实现云端管理,更重要的是打破了一代裸金属在网络和存储方面的桎梏。神龙服务器可以直接接入 ZStack 提供的网络和存储功能,用户可以便捷的应用弹性网络和云存储池等功能,最大程度的为用户提供弹性,同时降低平台的维护管理难度。

要实现如此高的目标,首先需要在硬件层进行创新。神龙服务器背后的关键创新是阿里云自行研发的神龙芯片。据阿里云神龙产品负责人王志坤介绍,通过神龙芯片加速引擎,消除了虚拟化对性能损耗带来的困扰,提升了网络与存储 IO 能力,并让所有的接口都和虚拟机保持一致,让用户使用弹性裸金属产品体验跟使用虚拟机是完全一样。

神龙芯片与 ZStack 结合之后产生了美好的化学反应,彻底改变了私有云的技术形态:通过神龙芯片,企业部署的物理基础设施可以轻松对接 ZStack 的存储和高级网络功能,形成集裸金属服务器与云平台优势为一体的弹性裸金属云,为企业带来性能强大、灵活多变、维护简便、成本实惠的云端基础设施。

通过 ZStack + 神龙架构,用户在私有云里面的部署和在公有云里面的体验一模一样,非常灵活方便。——张鑫

举例来说,ZStack 常用的 SDN、NFV 等网络功能和分布式存储池,在一代裸金属上几乎无法使用;但在基于神龙架构的弹性裸金属云上却可以无缝对接,使用体验和传统公有云毫无差异。

  • 功能完备:

用户轻点鼠标即可构建各类资源,过程完全自动化,灵活方便。用户甚至可以在创建出来的物理服务器实例上再创建虚拟机,实现嵌套虚拟化;也可以随时回收物理机、部署单个应用,或创建虚拟机等。整个过程中网络和存储部分都由 ZStack 提供,全程自动化处理。

  • 兼容异构:

由于神龙芯片接管了物理机网络和存储端的复杂性,ZStack + 神龙架构就可以轻松兼容各种物理机架构,无论是成熟的 x86 平台还是年轻的 ARM 等平台,都可以通过神龙芯片无缝接入 ZStack。用户无需等待非 x86 生态中的云端虚拟化软件成熟,即可尽早使用非 x86 设备搭建私有云平台,很好地解决了异构兼容性问题。

  • 利旧设备:

采用了神龙芯片的弹性裸金属云,得益于神龙芯片的独立性让平台的 IO 处理能力可以部分摆脱设备 CPU 性能的约束,芯片本身的升级就能带来 IO 能力的提升,使得很多旧设备也能发挥出很高的性能水平,让预算紧张的用户可以充分利用已有资源,节省成本投入。

  • 无缝扩展:

当用户现有的网络和存储资源无法满足业务日渐增长的需求时,用户只需轻点鼠标就可以加入新的资源池完成扩容,实现 IT 基础设施长期无缝扩展的目标。

迄今为止,神龙芯片已经进化到了第三代,自身性能仍在不断提升;ZStack 提供的网络和存储能力也在不断进步,技术特性愈加丰富。由于神龙芯片与 ZStack 对接的北向接口保持不变,因此两者各自的升级并不会影响双方的兼容性和深度集成,为用户保障了解决方案的长期稳定性,也保护了用户的投资。

2 ZStack + 神龙架构:企业私有云的新纪元

ZStack + 神龙架构的诞生,正逢国内私有云市场的井喷期。“新基建”大背景下,大批传统企业正在谋求云端数字化转型。考虑到数字资产保值、高性能计算和安全性需求以及企业财务风格等因素,私有云和混合云成为了企业在转型过程中的主流选项。而基于神龙架构的弹性裸金属云至少可以在五大领域满足企业上云的严苛需求。

  • 高性能计算:

2016 年,神威·太湖之光超算登顶 Top500 后,国内高性能计算市场开始了高速发展。传统的超算集群是线下封闭式的,主要承担科学计算任务;但随着越来越多的企业搭建起自己的超算平台,用户开始希望这些平台能够在更多场景中发挥作用,从而诞生了超算上云的需求。但高性能计算场景对虚拟化损耗是天然抵触的,只有零损耗的裸金属架构才能满足其性能需求。

弹性裸金属云的诞生恰好满足了这类场景需要兼顾性能和云端弹性的要求,以 ZStack 的一些气象部门客户为例,将高性能集群改造为 ZStack + 神龙架构以后,集群不仅可以承担气象预测等传统超算任务,还可以用空闲算力为整个部门提供灵活的私有云服务,执行多样化数据分析、云原生气象应用运营等工作,帮助气象部门在新基建时代向云端转型。

  • 容器场景:

伴随云计算兴起的容器技术已经在各行各业广泛流行。但很多传统行业试图通过容器技术打包自有业务时发现,传统的虚拟化容器不仅会有性能损耗,带来的性能波动更是关键业务所无法容忍的。例如,发电企业要在私有云上通过容器打包电厂的遥测、发电量数据分析、环保指标、设备联动等业务功能,但这些功能都要求极高的稳定性。对此,ZStack + 神龙架构的弹性裸金属云既能满足发电厂对私有云便捷特性的渴求,又能避免虚拟化技术带来的容器性能波动,是适用于这类场景的最佳选项。

  • 特殊应用:

传统行业在数字化转型时,往往会遇到很多遗留的软件和代码。这些应用不仅年代久远,如今也很难找到团队继续对其升级改进,但企业又不能简单地抛弃那些对运营至关重要的遗留应用。这种情况在金融领域尤其常见——一些代码甚至可以追溯到上个世纪,但企业上云时却只能将它们原样搬到云端继续提供服务,毕竟任何小错误都可能导致最终客户严重的财产损失。

这类代码在虚拟化环境中经常会出现“水土不服”的现象,不是没法兼容虚拟机操作系统,就是在运行时 bug 不断等等。而这些应用跑在神龙服务器上之后,水土不服的毛病也就从根本上得到了解决。与此同时,ZStack 所提供的云端网络和存储特性可以显著提升老代码的可维护性与健壮性——在现代化的云端灾备与管理技术帮助下,企业对这些老代码出错影响业务的担忧也能得到很大缓解。

  • 大数据场景:

大数据是新基建关注的焦点之一,也是许多行业上云的主要推动力。但大数据分析同样需要很高的性能和稳定性,且大数据集群机器众多、维护困难,数据的安全性是企业在利用大数据技术时非常关心的要素。如果数据出现泄漏、损毁,给企业带来的损失往往是难以承受的。

广电行业在采用大数据技术方面相当积极,ZStack 很多广电行业的客户就在将自身原有的海量音视频数据转移到大数据平台上,对这些资料进行标注和分析,挖掘其潜在价值。ZStack + 神龙架构不仅能够为这类用户提供所需的高性能输出,简化大规模计算集群的部署复杂度,还可以通过神龙芯片软硬结合的方案提供更好的计算安全性,降低数据泄漏和故障带来的风险。ZStack 提供的企业级分布式存储能力可以实现数十 PB 级的存储资源池,也非常适合大数据场景下的海量数据存储需求。

  • 特殊硬件场景:

传统制造类企业经常会在生产过程中使用一些较为特殊的定制化硬件,用于遥测、控制和通信等用途。例如某家化工厂使用了定制监控设备分析空气中的有害物质含量,这款设备的软件是无法兼容虚拟化环境的,但工厂特别希望设备数据能并入厂内的云平台,使维护人员可以随时监测空气质量。这样的特殊设备通过神龙服务器就能无缝接入 ZStack 云平台,帮助传统制造企业全面数字化、智能化,转型过程不留死角。类似地,一些有很高安全保密需求的客户所使用的加密硬件也无法接入虚拟机,同样是 ZStack + 神龙弹性裸金属的目标用户群体。

值得一提的是,在“新基建”背景下,国内很多企业开始在生产环境中引入各类非 x86 架构的 PC 和服务器;另一方面,不少企事业单位进行数字化升级改造的资源有限,无力负担新购设备的高昂成本,需要尽可能利用现有机器搭建私有云平台。针对这类需求,ZStack + 神龙架构出色的兼容性优势就可以发挥作用:神龙芯片接管了物理机的 IO 部分,不需要操作系统有完善的云生态环境;另外,神龙芯片的 IO 能力也不受物理机 CPU 制约,可以让相对老旧的机器也有不错的 IO 性能表现。当企业的硬件环境中有很多非 x86 机器,或者相对老旧的机器时,使用 ZStack + 神龙架构可以兼容各类异构物理环境,显著降低成本投入和资源浪费。

3 新基建时代,弹性裸金属云即将大放异彩

无论是哪一类用户,在向云端迁移业务时都希望迁移的过程尽可能顺利,迁移完成后的维护尽量简便。ZStack 自诞生以来就以简单易用、性能稳定等优势广受好评,与神龙架构结合后更是如虎添翼,将私有云的门槛降低到了大多数企业都能轻松跨越的程度。

总体而言,能从基于神龙架构的弹性裸金属云中获益的,并非只有那些存在高性能计算需求的企业,更多企业在面临私有云的弹性、可维护性、安全性、利旧能力、可扩展性、异构兼容性等需求时,都可以从神龙架构 + ZStack 这里找到完美的解决方案。不夸张地说,基于神龙架构的弹性裸金属云为企业私有云开创了一个全新的纪元,必将成为广大企业实现数字化转型的重要助推力量。

如今,ZStack + 神龙架构已经落地了很多案例,其中一家客户仅在两台物理机上安装 ZStack 软件,就成功控制了上千台神龙服务器,通过弹性裸金属私有云获得了完整的云平台功能。

提升效率、降低开销、简化维护、节约成本、增强安全性……基于神龙架构的弹性裸金属云为企业带来的这些收益,也是新基建时代各行业数字化转型过程中最看重的价值。在高速发展的私有云市场上,ZStack + 神龙架构有望赢得可观的市场份额,帮助大批企业将业务尽快迁移至云端,占据行业领先地位;基于神龙架构的弹性裸金属云也将藉此成为我国“新基建”浪潮中的一支生力军,乃至在全球云计算产业中也将大放异彩。







点个在看少个 bug 👇

登录查看更多
0

相关内容

云计算(Cloud computing)是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。整个运行方式很像电网,类似之前的网格计算。
专知会员服务
114+阅读 · 2020年8月22日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
菜鸟数据中台技术演进之路
互联网架构师
4+阅读 · 2019年10月23日
2018-2019年国内化妆品行业研究报告
行业研究报告
15+阅读 · 2019年9月28日
【中台】腾讯的中台逻辑
产业智能官
14+阅读 · 2019年7月22日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
日均5亿查询量,京东到家订单中心ES架构演进
51CTO博客
4+阅读 · 2019年1月16日
安全牛发布《威胁情报市场指南》报告
安全牛
13+阅读 · 2017年7月10日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Adversarial Metric Attack for Person Re-identification
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
Arxiv
7+阅读 · 2018年6月8日
VIP会员
相关VIP内容
专知会员服务
114+阅读 · 2020年8月22日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
相关资讯
菜鸟数据中台技术演进之路
互联网架构师
4+阅读 · 2019年10月23日
2018-2019年国内化妆品行业研究报告
行业研究报告
15+阅读 · 2019年9月28日
【中台】腾讯的中台逻辑
产业智能官
14+阅读 · 2019年7月22日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
日均5亿查询量,京东到家订单中心ES架构演进
51CTO博客
4+阅读 · 2019年1月16日
安全牛发布《威胁情报市场指南》报告
安全牛
13+阅读 · 2017年7月10日
Top
微信扫码咨询专知VIP会员