恢复带宽与时延的平衡丨品牌

2019 年 9 月 19 日 钛媒体

钛媒体 TMTPost.com

|科技引领新经济|

 

到目前为止,宽带增加的速度还远远超过了时延降低。


随着数据集规模的不断增长,数据中心负载对内存、存储的性能和容量的要求也在不断提高。与此同时,每单位时间需要处理更多数据,组成计算系统的组件性能也在不断提高。所谓性能,是一个涉及多方面的话题,其中一些指标(例如带宽)的增长速度就会比其它指标(例如时延)的增长速度更快。

 

计算机架构师必须在这些不断增长的数据集和可用技术的相对性能提升之间寻找交集,从而创建一个能够快速完成任务的计算系统。本文将简要介绍相关技术的发展历史,以及最新推出的英特尔®傲腾™技术。这种新技术提供了缩短时延和提高带宽所需的新资源,填补了计算系统中的传统关键点,从而加快了应用速度。

 

内存和存储——简短的历史发展进程


DRAM是一个高带宽、低延时的数据存储器,但是每比特成本相对昂贵。通过在系统中增加DRAM的数量可以应对数据集规模增加的问题,但这样做成本会非常高。十年前,当速度较慢的机械硬盘(HDD)是许多系统中唯一可用的数据存储器,大家没有更多可选择空间。然而,访问高延时的机械硬盘会因为等待数据浪费太多的处理器周期。

 

NAND固态盘(SSD)的出现不仅为存储数据提供了一个新空间,还能够加快对更多数据集的访问速度。因此,基于NAND的固态盘在市场上得到了广泛的应用。然而现在,即使是速度很快的NAND固态盘也对当今需要实时或近乎实时访问和处理数据的数据驱动应用有些力不从心。因为就像10年前的硬盘一样,这些固态盘会导致处理器花过长时间等待数据,这会增加时延,从而阻碍系统获得现代CPU能够提供的性能。随着时间的发展,CPU性能提升然而存储时延却没能同步,这会拖累整个系统的性能提升。

                                      

 图1:内存、处理器、硬盘和固态盘随时间推移的相对带宽改进vs相对时延改进

 

随着技术的进步,保持时延与带宽平衡


为证明技术的发展,有必要比较以下不同存储介质随时间推移的相对带宽性能改善和时延改进。基于David Patterson的一项关键研究,图1将固态盘数据点添加到Patterson的“时延滞后带宽”图表中1。Patterson指出,从历史上看,带宽改进的速度通常要比时延快得多。根据摩尔定律,晶体管的数量在稳步增加2 ,同时多核架构在不断演进。

 

这些改进使得处理器可以处理更多指令,同时与上一代处理器相比,可以在相同或更短的时间内处理更多数据。但随着CPU处理时间的缩短,从硬盘获取数据的时延并没有相应地缩短。这导致存储技术成为整体性能的瓶颈。对于内存和存储技术来说,可以通过并行性来增加带宽,但访问该技术的时间相对恒定。因此,只有引入新技术才能实现更低时延。

 

要理解为什么这很重要,就要考虑当时延减少、带宽增加时会发生什么。通常,对于内存和存储资源来说,访问一个单元的数据不足以填充从内存到处理器的路径,即带宽乘以时延(带宽时延乘积)大于访问尺寸。在可能的情况下,为了充分利用资源的带宽,会明确把软件编写为“并行请求更大或更多的数据块”。随着带宽时延产品的增长,越来越少的算法能够在请求足够数据的同时来满足时延要求。然而在无法支持的情况下,则会影响系统带宽和性能。从最简单的层面来说,这就是为什么拥有一个平衡的带宽/时延比很重要。

 

回顾图1,基于NAND的 固态盘的引入在一段时间内提供了一个平衡的带宽/时延解决方案,它们的时延比硬盘低得多。基础访问时间从硬盘的几毫秒缩短到NAND 固态盘的不到100微秒,这意味着等待数据所花费的CPU周期更少。由于许多应用能够经常访问NAND 固态盘的全部带宽,因此处理速度以肉眼可见的速度提高了。随着时间的推移,带宽不断增加,而时延则保持相对恒定,带宽的加倍使得系统再次失衡。

 

以下示例演示了如何使用英特尔®傲腾™技术部署低时延英特尔®傲腾™数据中心级固态硬盘,从而提高VMware vSAN *等超融合基础架构解决方案的性能和容量。

 

英特尔®傲腾™技术将vSAN*性能和容量提升到新的高度


企业业务和云服务提供商可利用英特尔®傲腾™技术,以非常经济的方式来提高虚拟服务器上运行的应用的性能。Evaluator Group的分析报告指出,英特尔®至强®可扩展处理器与英特尔®傲腾™技术和含NVM Express*(NVMe*)的英特尔® 3D NAND 固态盘相结合,可以为各种运行在使用VMware vSAN*的超融合系统上的常见负载提供更好的性能3。

 

如图2所示,与运行NAND 固态盘存储介质的系统相比,运行VMware vSAN * 6.7的系统(采用英特尔®至强®可扩展处理器和英特尔®傲腾™数据中心级固态盘)可显著提升性能。采用英特尔®傲腾™技术和英特尔®3D NAND 固态盘构建的系统能够支持最多1.6倍的虚拟机,同时仍可以为每个虚拟机保持相同的服务水平协议。

 

这相当于每个系统可多支持60%以上的用户,这对于盈利和业务增长非常重要。由于英特尔®至强®可扩展处理器、VMware vSAN * 6.7以及结合使用的高效英特尔®3D NAND 固态盘与英特尔®傲腾™数据中心级固态硬盘提高了虚拟机密度、降低了基础设施成本,从而带来了明显的成本效益。

 

研究得出的结论是,由于旧的存储技术无法满足虚拟机的输入/输出(I/O)需求,所以旧系统的性能较低。本质上,由多个活跃虚拟机驱动的高I/O负载导致NAND 固态盘备份大量工作,从而增加了数据时延,直到无法再维持虚拟机所需的服务水平协议。

 

VMware vSAN*的例子展示了一种“通过部署英特尔®傲腾™数据中心级固态盘来弥合数据中心内存与存储层级之间差距”的方法。经常访问英特尔®傲腾™技术网站,了解企业如何使用英特尔®技术,更好地满足现代数据中心的需求。

 

图2:采用英特尔®至强®可扩展处理器,英特尔®3D NAND 固态盘和英特尔®傲腾™数据中心级固态盘构建的较新VMware vSAN *系统,性能比仅基于英特尔®3D NAND 固态盘的系统最多高出1.6倍。


新的内存和存储架构


英特尔®傲腾™技术可以在系统中扮演多种角色。如前所示,英特尔®傲腾™数据中心级固态盘可以利用标准PCIe * NVMe接口连接到系统,通过平衡的带宽/时延来加速重要的数据中心应用。在这种形式下,空闲平均时延大约为10微秒,而NAND 固态盘则超过80微秒4 。图3显示了系统硬件和软件时延。英特尔®傲腾™数据中心级固态盘的硬件时延与系统堆栈软件时延大致相同,为系统带来了另一种平衡。即使在高负载下,始终如一的低时延以及高耐用性使这些固态盘成为快速缓存或分层热数据的理想选择。

 

英特尔®傲腾™技术现在也可作为直接插入DIMM插槽的英特尔®傲腾™数据中心级持久性内存模块使用。与DRAM DIMM不同,英特尔®傲腾™数据中心级持久内存具有持久性和更大的容量(每个模块最高可达512 GB)。如图3所示,使用英特尔®傲腾™数据中心级持久内存进行数据访问的时延要比使用英特尔®傲腾™数据中心级固态盘小得多。

 

英特尔®傲腾™数据中心级持久内存可以直接从应用访问,而不涉及操作系统存储堆栈,因此不再需要软件开销。对于持久内存,空闲平均读取时延下降到100到340纳秒。5相较之前提到的带宽时延产品的低时延,由于时延较低,因此可以使用较小的单元尺寸、一条高速缓存线访问该内存,同时仍然提供其全部带宽。因此,英特尔®傲腾™数据中心级持久内存是一种高速缓存线路可访问、高性能、持久的存储——是一种真正独特的新资源。

 

鉴于其高性能和持久性,英特尔®傲腾™数据中心级持久内存构成了另一个新的数据存储层,可以用各种方式来弥合容量与性能之间的系统差距。这种灵活性使企业可以构建能更好满足现代工作负载的处理和内存需求的数据中心,例如,英特尔®傲腾™数据中心级持久内存可显著提高内存数据库的容量。而且,由于持久性内存是非易失性的,因此不需要在数据库重新启动后将数据重新加载到内存中,从而提高了可服务性和系统正常运行时间,并改进了业务连续性。

 

图3:NAND固态盘、英特尔®傲腾™数据中心级固态盘和英特尔®傲腾™数据中心级持久内存的时延比较。

 

结论


在计算系统中,内存和存储层级结构把更频繁访问的数据放在更靠近处理器的位置,同时把占多数的数据移动到远离处理器、更便宜的内存中(时延更高)。内存和存储技术的固有时延往往会随着时间的推移而缓慢下降,而处理器的性能会以更快的速度提升。这将有效地把这些内存移到离处理器更远的位置,因此,处理器需要花费更多指令周期等待数据。只有引入新的低时延内存技术以及新的、更紧密集成的系统集成点,才能使系统恢复平衡。

 

随着英特尔®傲腾™技术的引入,英特尔为系统提供了一个新的内存来弥合DRAM与NAND固态盘之间的差距。作为固态盘和持久内存,全新英特尔®傲腾™技术使计算机架构师能够将大型持久数据结构离处理器更近,从而尽量缩短等待数据的时间并加快应用执行。当系统架构师平衡好带宽需求和低延时,就释放了CPU的强大功能。通过英特尔®傲腾™技术恢复带宽与时延之间的平衡,CPU现在可以快速消耗和处理数据,从而达到最佳系统性能。

 

英特尔院士:Frank Hady博士


Frank Hady是英特尔院士兼英特尔非易失性内存解决方案事业部(NSG)傲腾系统首席架构师。Frank负责研究和定义英特尔®傲腾™技术产品及其与计算系统的集成。Frank曾担任英特尔领先的平台I/O架构师,为英特尔®QuickAssist技术(英特尔®QAT)提供研究基础,并推动了平台性能显著提升。他撰写或联合撰写了30多篇关于网络、存储和I/O创新主题的论文,并经常发表关于内存和存储的文章。他拥有30多项美国专利。Frank获得弗吉尼亚大学的电子工程学士和硕士学位,并拥有马里兰大学电子工程博士学位。

 

了解更多信息


较低且一致的时延只是英特尔®傲腾™技术的一部分。通过“内存和存储技术系列”中的其它论文,进一步了解英特尔®傲腾™数据中心级持久内存和英特尔®傲腾™数据中心级固态盘如何颠覆数据中心内存和存储层级结构。


进一步了解英特尔®傲腾™技术,请访问:intel.com/optane,通过以下链接(https://intel.com/content/www/us/en/products/docs/memory-storage/optane-technology/what-is-optane-technology-brief.html)阅读题为“英特尔®傲腾™技术是什么”的技术简介。


进一步了解关于英特尔®傲腾™数据中心固态盘,请访问:https://intel.com/content/www/us/en/products/memory-storage/solid-state-drives/data-center-ssds/optane-dc-ssd-series/optane-dc-p4800x-series.html


进一步了解英特尔®傲腾™数据中心级持久内存,请访问:


https://intel.com/content/www/us/en/architecture-and-technology/optane-dc-persistent-memory.html。

 

产品和性能信息


1 David A. Patterson。“时延滞后于带宽”。ACM通信,47卷,10号,2004年10月。https://dl.acm.org/citation.cfm?id=1022596。英特尔® 3D NAND和英特尔®傲腾™数据中心级固态盘数据点由英特尔根据产品规格进行添加,包括英特尔®固态盘X-25M,英特尔®数据中心级固态盘S3700、英特尔®数据中心级固态盘P3700、英特尔®数据中心级固态盘P4600和英特尔®傲腾™数据中心级固态盘P4800X。更多信息见:英特尔。“英特尔®数据中心级固态盘系列。” https://intel.com/content/www/us/en/products/memory-storage/solid-state-drives/data-center-ssds.html


2 来源:Intel.com。摩尔定律。1965年,戈登·摩尔预测了现代数字化演进的速度。通过仔细观察一个新的趋势,摩尔推断说,计算性能会以指数方式大幅提升,而相对成本会以指数方式下降。这被称为摩尔定律,是电子行业的黄金法则,也是创新的出发点。作为联合创始人,戈登·摩尔为英特尔制造更快、更小、更便宜的晶体管指明了发展方向,而这些晶体管被广泛地用于我们的现代工具和玩具等等。


3 Evaluator Group。“实验室洞察:最新英特尔®技术提升VMware vSAN*的性能——2018年更新”,2018年10月。https://www.evaluatorgroup.com/document/lab-insight-latest-inteltechnologies-power-new-performance-levels-vmware-vsan-2018-update/


4 来源:英特尔测试:在4k随机写入工作负载期间使用1队列深度测量的平均读取时延。测量使用了FIO 3.1.对比英特尔参考平台,其中配备了英特尔®傲腾™数据中心级固态盘P4800X 375GB和英特尔®数据中心级固态盘P4600 1.6TB,对比了2018年7月1日商业上可用的固态盘。性能测试结果来自截至2018年7月24日的测试,可能并未反应所有公开可用的安全更新。详情见配置信息部分。任何产品都无法保证绝对安全。


5 英特尔®傲腾™数据中心级持久内存:基于英特尔在2019年2月20日测试的结果。配置:英特尔® LBG B1芯片组,28核英特尔®至强®可扩展处理器(QDF QQYZ),每秒2,666 兆传输率(MT/s),256 GB,18 W,32 GB DDR4 DRAM(每个插槽),128 GB 英特尔®傲腾™数据中心级持久内存(每个插槽),固件:5336,BIOS:573.D10,WW08 BKC,运行Linux* OS4.20.4-200.fc29*。禁用性能调优服务质量(QoS),IODC=5(AD)。


6性能测试结果来自截至配置信息所示日期的测试,可能并未反应所有公开可用的安全更新。详情见配置信息部分。


任何产品或组件都无法保证绝对安全。


在性能测试过程中使用的软件及工作负载可能仅针对英特尔微处理器进行了性能优化。SYSmark 和 MobileMark 等性能测试使用特定的计算机系统、组件、软件、操作和功能进行测量。上述任何要素的变动均有可能导致测试结果的变化。您需要参考其他信息和性能测试以帮助您全面评估您正在考虑的采购,包括产品在与其他产品结合使用时的性能。如欲了解更多完整信息,请访问 www.intel.com/benchmarks。


英特尔技术的功能和优势取决于系统配置,可能需要激活支持的硬件、软件或服务。实际性能可能因系统配置的不同而有所差异。


任何产品或组件都无法保证绝对安全。请咨询您的系统制造商或零售商,也可登录 intel.cn 获取更多信息。


本文所述的降低成本例子是为了说明制定环境和配置中给定的基于英特尔的产品可能会影响未来成本并节省成本。情况可能有所不同。英特尔并不保证任何成本或成本降低。


英特尔不控制或审计本文中提及的第三方基准测试数据或网站。请访问参考网站并确认参考数据是否精确。


英特尔、英特尔标识、英特尔傲腾和至强是英特尔公司或其子公司在美国和其他国家(地区)的商标。

 

关于英特尔


英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。如需了解更多信息,请访问英特尔中国新闻中心 newsroom.intel.cn 以及官方网站 intel.cn。

 

英特尔和英特尔标识是英特尔公司在美国和其他国家(地区)的商标。


*文中涉及的其它名称及品牌属于各自所有者资产。

 

如有疑问请垂询:

英特尔(中国)有限公司
赵佳  女士
电话:  010-5751   1407
E-mail: jia2.zhao@intel.com   
奥美公关
孙瑾宇 女士
电话:010-8520 3090
电子邮件:sara.sun@ogilvy.com
 


发现钛媒体,72问新生机;

碎片时间,系统学习


点击阅读原文或识别上方图片二维码 下载 钛媒体App」精彩不容错过
我就知道你“在看”
登录查看更多
0

相关内容

英特尔公司是世界上最大的半导体公司,也是第一家推出x86架构处理器的公司,总部位于美国加利福尼亚州圣克拉拉。由罗伯特·诺伊斯、高登·摩尔、安迪·葛洛夫,以“集成电子”之名在1968年7月18日共同创办公司,将高级芯片设计能力与领导业界的制造能力结合在一起。 维基百科
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
70+阅读 · 2020年1月17日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
96+阅读 · 2019年12月4日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
94+阅读 · 2019年11月13日
深度神经网络模型压缩与加速综述
专知会员服务
129+阅读 · 2019年10月12日
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
云游戏行业发展趋势分析报告
行业研究报告
13+阅读 · 2019年3月24日
已删除
将门创投
9+阅读 · 2018年12月19日
SLA 99.99%以上!饿了么实时计算平台3年演进历程
51CTO博客
11+阅读 · 2018年4月10日
热烈祝贺南京某高校DGX-1深度学习超级计算机集群顺利交付
北京思腾合力科技有限公司
5+阅读 · 2017年11月18日
Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算
Arxiv
5+阅读 · 2018年10月11日
Arxiv
3+阅读 · 2018年3月2日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
9+阅读 · 2018年1月4日
Arxiv
5+阅读 · 2017年7月23日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
云游戏行业发展趋势分析报告
行业研究报告
13+阅读 · 2019年3月24日
已删除
将门创投
9+阅读 · 2018年12月19日
SLA 99.99%以上!饿了么实时计算平台3年演进历程
51CTO博客
11+阅读 · 2018年4月10日
热烈祝贺南京某高校DGX-1深度学习超级计算机集群顺利交付
北京思腾合力科技有限公司
5+阅读 · 2017年11月18日
Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算
Top
微信扫码咨询专知VIP会员