作者:David Floyer效力IBM 20多年,在IBM法国公司担任过研究、销售、营销、系统分析和IT运营等岗位。他直接与IBM的最大欧洲客户打交道,包括宝马、瑞士信贷、德意志银行和劳埃德银行。他曾是国际数据公司(IDC)的研究副总裁,是IT战略、经济价值论证、系统架构、性能、集群和系统软件方面的知名专家。
Wikibon预计,在分布式高价值应用环境中,与自己动手做(DIY)的传统x86白盒或品牌服务器相比,x86超融合全栈式解决方案将提供更低的“线下”(below-the-line)IT运营成本。x86白盒解决方案的成本可能比超融合全栈式解决方案高出50%。
Wikibon还预计从全栈式方法获得的线上(above-the-line)业务效益要高得多。业务效益包括创造价值的时间更短、更新更频繁、响应速度更快、可用性更高、恢复速度更快以及安全性更高,它们的价值可能是IT成本节省这方面价值的5倍。
Wikibon的研究报告阐述了上述结论,使用Oracle高可用性数据库机(ODA)及Oracle数据库企业版和Oracle真正应用集群(RAC)作为超融合全栈式数据库解决方案的参考模型。
注:线上和线下的定义请参阅下面的“了解总体拥有成本”章节。
摘要
大多数企业采用混合云战略,拥有多个私有云和公共云,许多企业采用传统的DIY方法。我们的研究表明,在许多情况下,IT和业务领导人应重新考虑这种方法。Wikibon认为,实行数字化转型时,构建、部署和维护x86白盒部件的这种传统的企业战略常常难以为继。运营成本太高,创造价值的时间通常被延迟。
Wikibon的分析和建模在高价值高可用性应用分布式环境下将超融合全栈式方法与传统的x86白盒DIY方法进行了比较。我们使用的参考模型系统是Oracle高可用性数据库机(ODA)系统。Wikibon发现,超融合全栈式方法为IT和业务带来了890万美元的纯效益。详细分析显示,白盒的IT运营成本3年内比ODA高出57%。Wikibon的研究还表明,因ODA缩短创造价值的时间(更新时间和实施时间)带来的业务效益比IT运营成本效益高出5倍。
Wikibon认为,企业管理层需要致力于消除千篇一律的IT手工劳动,并制定策略来提高IT对业务的贡献。要关注的领域是为新应用缩短创造价值的时间,加强安全性、合规性和可用性,以及提升更快地实施系统和应用软件更新的能力。超融合全栈式解决方案将大大有助于实现这些目标。
下面图1显示了与x86白盒解决方案相比,超融合全栈式ODA解决方案的业务价值和IT价值。IT成本效益(线下*)源自更低的实施、运营和Oracle数据库许可成本。线上效益源自缩短了实施解决方案的时间(ODA仅需7天,白盒解决方案需要34天),以及3年内加快了更新和升级解决方案的速度(每季度而不是每年)。分析报告的细节详见下面的商业价值方法和商业理由分析章节。
超融合全栈式解决方案与x86白盒基础设施的全面业务价值分析,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
我们的分析表明,与传统的x86白盒方法相比,超融合全栈式方法的净效益为890万美元,净现值为820万美元(折扣率为5%)。分析显示,在分布式高价值应用环境中,白盒3年内的IT成本比超融合全栈式系统高出57%。Wikibon的研究还显示,超融合全栈式系统缩短了创造价值的时间,因此获得的线上业务效益比IT运营成本效益高出5倍。
大多数企业采用混合云战略,拥有多个私有云和公共云。Wikibon的结论是,构建和维护低成本x86白盒部件基础设施这个传统的企业战略在现代混合云领域难以为继。未来的改进将包括自动化和优化带来的重大贡献。两者都需要来自多个安装系统的大量技术信息。批量提供集成式超融合自动化和优化解决方案的厂商将最有能力交付和不断改进解决方案。
Wikibon认为,企业管理层需要致力于消除千篇一律的IT手工劳动,并制定策略来提高IT对业务的贡献。要关注的领域是为新应用缩短创造价值的时间,加强安全性、合规性和可用性,以及提升更快地实施系统和应用更新版的能力。超融合全栈式解决方案将大大有助于实现这些目标。
下一章节解释了线下IT效益与线上业务效益的区别。
了解总体拥有成本
“线下”TCO分析
*“线下”这个财务术语是指运营支出。图2列出了运行高价值记录系统应用软件的计算机系统的运营支出。假设ODA的硬件成本略高于白盒,但软件和支持成本低得多。总体而言,在这个例子中,x86白盒环境的IT运营支出比超融合全栈式ODA解决方案高出57%。
详细分析超融合全栈式解决方案与x86白盒基础设施的IT成本,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
这个结果与Wikibon在融合系统方面的其他研究报告高度相关,这些研究一致表明,作为集成解决方案来销售(只握一只手、只卡一个喉咙)的融合和超融合解决方案的IT运营成本低得多。
“线上”TCO分析
*“线上”通常指与产品有关的账目。在IT中,该术语是指与业务部门本身运营企业有关的效益类别。这些效益常常被称为“软美元”。
创造价值的时间就是线上业务效益的一个例子。下面图3表明了在ODA上部署应用软件可以比DIY x86白盒系统快5倍上线这一结果背后的细节。下面表1更详细地显示了数据是如何算出来的。
超融合全栈式解决方案与x86白盒基础设施各自创造价值的时间的详细分析,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
线上效益的难题在于用美元来表示这些效益的价值。我们在下一节将探讨Wikibon开发的特定方法,帮助IT部门表示线上效益。详细评估了两个特定的效益。它们是:
缩短创造价值的时间带来的财务效益,如图1和图3所讨论的。
每季度更新运行应用软件的整套超融合全栈式系统带来的效益。这使得预先测试的补丁和升级版可以更早、更频繁、更快速、更轻松地作为一项逻辑任务来加以部署。这可以更早地改进系统和应用软件功能,因此带来了业务效益。
这个方法在下一节中加以解释和运用。
分析业务价值的方法
该报告在Wikibon之前的全栈式系统研究的基础上另外分析了企业可获得的线上业务效益。下面表1显示了用于推导出上述图1所示效益的详细单项、假设和计算。
表1:超融合全栈式解决方案与x86白盒基础设施的业务和IT价值的详细分析,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
表1中的“a”这行表明了这个假设:在任何一个时候,应用软件被企业中平均100名全职员工(FTE)使用(在一些时间通常会有多得多的用户使用该应用软件)。表1中的“f”这行表明了100名FTE的全部成本每年1030万美元。
表1中的“i”这行表明了应用软件价值的计算。它基于Wikibon的这项研究:员工对企业所创造收入的平均贡献是全部薪水的4倍。Wikibon假设,员工使用IT应用软件时的贡献与其他任何业务活动一样高,因此应该是全部薪水的4倍。“i”这行是每年4080万美元。
Wikibon的研究还显示,由于业务变化和整体商业环境的变化,应用软件的价值每年下降约10%。需要竭力维护应用软件和基础设施环境,以保持应用软件的业务价值和用户的生产力。在传统白盒环境中,这些更新和升级通常每年进行一次。ODA方法允许每季度进行一次全面的综合升级。表1中的“l”这行计算这两种环境下的价值损失(解释一下:公式中的50%表明一年后价值减少10%,全年的平均损失是年末价值的50%)。“n”这行表明应用软件价值减少的差异(3年内减少460万美元)。
“o”这行表明实施项目的时间差异,源自下面表2中的分析。ODA超融合全栈式方法的实施时间短27天,即多创造了27天的应用软件价值。这个额外的价值用表1的“p”这行来计算,第一年的效益为310万美元。
“s”这行的IT成本差异源自表2。“u”这行表明IT预算净节省120万美元,这是线下节省。
表1的“v”这行显示了3年内使用超融合全栈式系统在增加的应用软件价值(线上)和降低的成本(线下)方面带来的价值共计890万美元。
ODA超融合全栈式
Oracle数据库专为拥有很高业务价值的极高可用性Oracle数据库应用软件设计。部署的应用软件常常是业务运营所必需的核心的企业记录系统。如果这些应用软件停运,业务会随之停运。Oracle数据库被认为是市场上功能最强的数据库,被广泛部署于这些类型的应用软件。
Oracle数据库传统上在本地运行。Oracle数据库日益在Oracle云端运行,或者在Oracle本地云解决方案中运行。
Oracle数据库机(ODA)允许Oracle数据库提供分布式小型系统,具有软硬件可用性很高的特点。因此,它支持本地易于使用,还能够完全远程管理。它允许全面集成到Oracle云,用于备份和恢复等服务。一项独特的功能是跨私有云和公共云保证数据库的完整性。
参考配置由两个ODA X7-2-HA基础系统构建而成。这两个系统总共提供144个核心和42.4 TB的存储空间。它在两个地方提供足够的冗余容量,支持最多200名全职员工或客户使用系统的峰值需求,峰值平均比为2。
每个ODA X7-2-HA是超融合Oracle集成系统,它将计算、存储和网络资源与全套Oracle软件服务集成在一起。软件包括虚拟机管理程序(OVM或KVM)、Oracle Linux操作系统、Oracle数据库和设备管理软件。OVM部署在参考系统中。每个X7-2-HA参考系统共有来自两台服务器的72个核心和786 GB内存,每台服务器有2个插座。
每套ODA X7-2-HA配置都是可扩展的基本系统。基本系统共有13只固态硬盘(SSD),存储容量共计21.2 TB。两台服务器之间有16 TB的共享原始存储空间,来自5只SSD。3.2 TB的共享存储空间专用于重做日志(Redo Logs),来自4只SSD。1.9TB的存储空间专用于操作系统和Oracle数据库软件,来自每台服务器的2只内部M.2 SATA SSD(已镜像)。
两个ODA X7-2-HA系统中,Oracle数据库配置有24个Oracle软件许可证,144个核心中的48个有许可证。Oracle数据库是企业版数据库,包括诊断软件包、调优软件包、Active Data Guard和真正应用集群(RAC)。在Oracle标价的基础上打50%的折扣。
ODA有完全冗余的电力和冷却设备。服务处理器包括Oracle集成无人值守管理器(Oracle ILOM)和Oracle自动服务请求(ASR)。设备管理器旨在全面管理软件,可实现远程管理,成为Oracle云网络的一部分。它还使用针对特定设备专门设计的预先测试的补丁包,对整套设备(包括所有固件和软件)打补丁,只需要打一次,大大简化了维护工作。
ODA有一些与Oracle数据库集成起来,但x86白皮书服务器上没有的特定功能。这些功能是:
混合列压缩:这项功能在数据仓库环境中很有用,可以压低Oracle数据库存储需求。该功能取决于了解Oracle集成系统所特有的Oracle数据库结构。它在通常面向行的OLTP应用软件中不太有用。
Oracle数据库快照:这项功能很有用。传统快照需要让数据库处于静默状态,并清空缓冲区。由于软硬件紧密集成,Oracle数据库快照不需要暂停数据库,几乎是即时的。这支持更频繁地获取快照,并提升恢复点目标(RPO)和恢复时间目标(RTO)的服务级别协议(SLA)。
为云备份保证数据库完整性:数据库软件和系统硬件支持检查数据端到端完整性的功能。
内置的本地和远程监控:上面讨论了Oracle ILOM和ASR功能。
下面表2给出了系统配置和单项成本的全面分析。
x86传统白盒
用来比较的x86白盒是使用同样或同等部件的DIY配置,提供总量相同的CPU、存储和网络容量。144个核心中的72个核心(每台服务器1个插座)拥有Oracle数据库软件的许可证。假设硬件成本比ODA配置低35%。表2给出了配置、软件和硬件价格的完整细节。
白盒系统被配置成高冗余性。不包括来自本地和远程监控功能的自动化技术。
下面表2给出了配置和单项成本的完整分析。
IT成本计算
下面表2给出了详细的IT成本假设和计算。表1中使用了总体IT成本数字。上面表1中使用了详细的IT人员成本计算,包括设计、采购、安装软硬件以及维护软硬件的小时数。
表2:超融合全栈式解决方案与x86白盒基础设施的IT成本的详细分析,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
商业理由分析
下面表3显示了比较超融合全栈式ODA解决方案与传统白盒方法的商业理由。
表3: 超融合全栈式解决方案与x86白盒基础设施的IT商业理由,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
表3显示,3年内采用超融合全栈式方法带来的线下IT节省是120万美元。
下面表4显示了线上和线下单项的商业理由,并显示了实施应用软件的总体商业理由。该表显示,就实施应用软件的3年总体业务效益而言,使用全栈式方法是8740万美元,而部署传统白盒方法是7850万美元。
分析显示,使用ODA部署超融合全栈式方法的总效益是890万美元。净现值是830万美元(折扣率为5%)。
表4:超融合全栈式解决方案与x86白盒基础设施的线上线下商业理由,运行分布式高价值记录系统工作负载。(资料来源:Wikibon 2018)
该分析只是商业价值的保守观点,因为它没有考虑超融合全栈式解决方案更高的可用性和可恢复性,也没有考虑使用集成ODA方法缩短响应时间带来的高生产力这一潜在效益。
讨论和结论
大多数企业在转向连接多个私有云和公共云的混合云战略,因为靠近数据的地方来处理数据出于实际和合规的需要。Wikibon预测,“真正私有云”将是云计算行业的主要组成部分。真正私有云的一个关键特点是,它们是融合或超融合的;一家厂商负责提供该解决方案。关键要求是只握一只手(针对初始部署、维护和升级)和只卡一个喉咙。ODA是真正私有云的一个例子。
分布式计算的最大挑战是IT成本。IT始终是人力密集型,分布式环境缺乏技能更是加大了挑战。当需要高可用性的高级数据库系统呈分布式时,挑战加大。分配给远程基础设施和数据库系统管理的大部分人力是千篇一律的投入。
解决办法是使用易于安装和运行的分布式系统。支持的各个方面都需要自动化,而远程操作是先决条件。相对基于白盒的DIY系统,集成的全栈式系统将运营成本至少降低了30%,因此改变了游戏规则。这是“线下”效益,直接节省了IT成本。
如果考虑到线上业务效益,集成解决方案的商业价值体现得更为明显。实施IT项目的原因是提高生产力、增加收入并降低业务风险。
至于风险方面,值得一提的是,征信所艾可飞(Equifax)无法使用2017年3月发布的补丁来更新系统。因而,2017年5月发生了1.43亿美国人的敏感数据泄密事件,成千上万个身份被盗,这对艾可飞的品牌声誉造成了巨大损失。该分析表明,如果缩短创造价值的时间,更快速、更频繁地更新系统和应用软件,有望获得极其显著的效益。
应对风险的战略性解决办法是不断加强系统自动化。厂商通常拥有更多的数据和更多的专业知识,为真正私有云解决方案开发利用AI的系统自动化和快速恢复技术。
超融合(HCI)行业交流群欢迎加入,群主微信:aclood(备注任职单位+职位,否则不予通过)
相关阅读:
Gartner:2018年全球超融合集成系统(HCIS)收入增幅 55%
Gartner:超融合基础设施系统的好坏完全取决于软件定义存储!