谁与争锋|神龙三代,集大成而来!

2019 年 9 月 28 日 CSDN云计算
戳蓝字“CSDN云计算”关注我们哦!

“一直以来,阿里云都始终坚持自主研发,我们挑剔和控制掌握每一行代码,就是做到为用户提供更加稳定与可靠的服务,保障永不停机的计算服务,是我们的使命。”这是2019年杭州云栖大会上,阿里巴巴合伙人、阿里云智能基础产品事业部总经理、研究员蒋江伟,花名小邪的压轴之词。


科技发展到今日,早已没有人质疑云计算乃是最主流的企业IT基础设施之一,是使命也是信仰,小邪昨日重磅砸出了基于神龙架构的第六代ECS实例,又迈出了“计算永不停息”的关键一步。


第六代ECS实例: “计算永不停息”

据晶少了解,这代ECS实例的计算性能相比前辈一代提升了20%,内存延迟降低 30%,ESSD云盘延时也降低 70%之多; 更重要的一点,TA适用于多种计算场景,包括大数据、离线等且表现越发稳定。 举个例子来说,每一百万次计算中只有一次计算抖动,与传统物理服务器相比,整体宕机率下降高达80%。 “这是一个怎样的概念? 通常来说每一万台服务器正常被使用的前提下每天就会有三台出现宕机现象; 但如今基于神龙架构的新款ECS已经能够做到一万台服务器中只有0.6台服务器出现宕机,两者相差五倍,这点其实对于用户来说非常关键。 ”小邪补充道。



在这个成本优先的环境中,要问如此极致性能的体验,背后价格几何,普惠才是王道! 对此阿里云方面表示,基于新架构的各产品依照不同的情况最高可降价幅度达58%以上。 另外更加值得画圈圈的是,神龙架构对火热的云原生浪潮下容器等产品的适配程度极高,毕竟通过 I/O offload 芯片加速,高效调度和自动化弹性伸缩的容器化产品可帮助用户降低50% 的计算成本,性能比物理机更加优越。


更关键的,新款计算实例的计算能力也是可圈可点,例如在交易服务场景中,与同规格的物理服务器相比其性能提升十分明显,从最初的3.4万QPS提升到4.4万QPS,提升达30%,延迟降低60%,在没有修改一行代码的前提下达成如此成绩实在可喜。 为何新款ECS会有如此高性能的表现? 主要源于自身架构的不断突破以及长达十年的的技术积累,所谓“十年自研积淀让阿里云有机会突破自我,找到进化的方向”就是这个道理。


神龙三代,终于显露头角

了解第六代ECS实例的童鞋们都知道,此款实例“建设于神龙架构之上”的事实不容忽视。 掐指一算,从2017年发布第一代神龙架构开始,阿里云就独自研发解决方案,最终突破了虚拟化的性能束缚,彻底激发了服务器释放 100%潜能,重构云计算的基础设施; 而最新重磅发布的第三代自研神龙架构,更是贯穿了整个IaaS计算平台,并在 IOPS、PPS 等方面提升5倍性能,用户可以做到在云上获得物理机100%的计算能力。



具体来说,三代神龙成功加入了自研的虚拟化操作系统以及芯片,通过硬件加速的方式将虚拟化开销降低并接近于零,并通过芯片加速的方式让存储、网络等IO性能大幅度提升,云盘性能更是达到百万。


谈及神龙架构金属服务器与容器的“天生一对 ”,小邪表示过去人们总认为容器的最佳CP是物理服务器,但其实忽视了几个属于物理服务器的天生缺陷,即无弹性、不稳定、共性连困难以及迭代速度缓慢等; 而基于神龙架构的裸金属服务器,既具备传统物理机的最佳性能又兼具虚拟机的灵活性,“因为我们在虚拟化技术中采用了硬件隔离的方式,使裸金属服务器的安全性也很高,并且将存储、网络的IO运算封装在芯片中,果断实现了端到端安全; 再加上阿里云本身的迭代周期完全可以达到最快达每周一更新,远远超过了传统意义上半年一迭代的速率。



提及神龙架构带来的端到端安全保障,同样在飞天智能的主会场,昨天阿里云数据库掌门人李飞飞最新发布的全加密云数据库最能说明这一点。 据晶少了解,在这款新品数据库中,用户可以利用自己生成的密钥对数据在云端进行全程加密保护,根源在于结合了神龙架构服务器。


其实两方的合作主要源于后来阿里内部All  on  ECS的项目,之所以可以做到帮助云数据库做到即便被攻破也无权浏览其中数据,归功于神龙架构提供的加密计算能力。 “我们有很多安全防护设置在其中。 一方面,不单单是“阿里云产品全家桶”产品可以使用,外部的生态合作伙伴也可以使用加密计算服务来搭建属于自己的安全能力,这种开放性就是为了帮助更多企业达成云上业务创新的目标。


此外更关键的是,在历经软件虚拟化、通用硬件虚拟化、专用硬件芯片虚拟化三个阶段之后,第三代神龙架构已经实现了裸金属服务器、ECS 虚拟机等计算平台的架构统一,用户可以更加便捷获得高质量的弹性资源。


总体来说,作为技术计算类别产品的中台,三代神龙相比之前最核心的升级就是各项参数与指标都有了极大程度的提升,尤其是在控制虚拟化开销、隔离技术以及应用场景等方面,尽管与之前的二代神龙相比在整体架构方面区别并不是很大。 具体,几代神龙在虚拟化开销方面主要基于裸金属的虚拟化技术,即为无限接近物理机的虚拟化技术。 “三代神龙开销更小,甚至可以将CPU忽略; 不止应用于通常情况下的大数据、在线业务等系统,还可以作用在网络上,甚至是边缘。 ”技术升级是显而易见的。



如果说一代神龙助力企业大规模无顾虑上云,二代神龙优先实现资源并池,那三代神龙究竟为何横空出世?仅仅只是追求三部曲的技术指标升级吗?


对于晶少的这个问题,阿里巴巴研究员,阿里云智能创新产品线总负责人旭卿表示,主要还是需求驱动使然。 “过去我们遇到大型数据库上云,只需要推荐到PolarDB就可以了; 然而,随着云计算不断向纵深方向发展,非数据库类的大型应用越来越多,对于IO存储能力以及网络转发能力都会有不同程度的需求变化。


面对神龙的多角度优势,有的小伙伴或许会想在线定下一台神龙并飞速搬到自家的数据中心里放肆用起来,针对此晶少得知,其实目前神龙在专有云方向可以做到线下输出,但一般情况下不提倡直接贩卖物理机的形式,主要还是基于云上发挥功能。 究其原因,更多在于神龙的出现,原本就是基于云上研发才能充分发挥其弹性功能,甚至可以做到与其他阿里云系列产品,例如盘古、洛神等联合使用助于发挥更强大的功能。


一路走来的神龙架构

2017年,一代神龙架构震撼现世,主要采用了自主研发的虚拟化2.0技术,兼具“虚拟机的心脏”和“物理机的肌肉”,被认为是云计算领域的新物种。 如果仔细梳理神龙架构,我们发现很大程度上绕不开虚拟化技术的发展,甚至神龙可以被定义为是虚拟化技术的一个延伸。 无论是从1974年第三代虚拟化架构的新时代要求,还是VMware公司成立等,真正把虚拟化带入应用阶段仅仅才刚开始,以前更多较倾向于理论研究。



对此阿里巴巴研究员,阿里云智能创新产品线总负责人旭卿提及,2009年阿里云开始着手弹性计算,最早使用了开源的Xen; 但经过几年的发展,就在2016年,众多从事基础IT的阿里人不禁反思: 在云数据中心时代,究竟怎样的虚拟化技术可以满足日益增长的需求,毕竟几十年的虚拟化技术发展以来,但底层架构几乎未变。 是不是可以做一些软硬融合或者软件硬件协同的创新来提高虚拟化的效率?毕竟传统物理机缺陷日渐凸显。


通常情况下,一台物理机中包含宿主机以及虚拟机,出现最多的情况就是资源“争抢”,这就会导致虚拟化效率的降低甚至频繁出现波动性。 此外,云计算要配合虚拟化自然要消耗大量资源; 想要做到效率高、性能佳,除了消耗大量的CPU资源之外似乎并没有更好的办法 ,相比之下成本激增就是个问题。 所以在更高的计算性能、更快的网络接入,更高的存储读写能力的综合要求下,神龙就这样应运而生了。 “我们重新定义服务器的架构,让它更好地服务今天的虚拟化技术,计算效率大幅度提升。



可以清晰地看到,发布以后2018年初神龙一代就实现全面商业化,在大规模在云上部署来主要满足大客户上云的需求。 一代神龙之后,阿里方面发现,如果传统的虚拟化生产虚拟机和现在使用不一样的计算架构,就会带来两个资源池,成本大幅度上升。 如何做到一套架构既可以支持裸金属服务,又可以支持传统的虚拟机,提供更高的服务质量,更好地支持容器,还能很好地兼顾成本、技术发展? 在此背景下,真正让虚拟机在神龙架构下性能飞起来,FPGA毫秒级热升从中带来很大帮助,完成技术融合与资源并池,成为神龙二代的主要着力点。



如今神龙三代已大成推出,主要集中在系统内部的优化部署,可以简单概括为芯片的硬化功能。 有数据显示神龙架构和非神龙架构的业务吞吐会高30%,并且延迟保守不动,低负载和高负载完全一样; 同时CPU利用率也会大幅度下降, 通俗来说原来需要一万台服务器完成的任务,现在只需几千台就可以,这就是神龙架构带来的最直观优势。



如今神龙架构已经统一整体阿里云的计算资源产品,无论是ECS还是容器以及裸金属服务器等,整个平台所有的技术红利都因此被享受到。 “接下来,阿里云遍布全球的百万服务器将全面升级至第三代神龙架构。 ” 小邪透露,在阿里巴巴内部,神龙架构已大规模应用于淘宝、天猫、菜鸟等业务,解决高峰值的性能瓶颈问题。


今天云栖已走过十年光景,我们惊奇地发现盘点今年大秀,阿里发布了更多芯片以及硬件产品 ,软硬件一体化的趋势尤其明显。 晶少觉得,随着技术不断升级发展,未来很大程度上是软件、硬件和芯片的垂直化、一体化设计,或许这也是神龙架构一代代演进以及有关阿里云基础设施变革思考的初衷。





福利
扫描添加小编微信,备注“ 姓名+公司职位 ”,入驻【CSDN博客】,加入【 云计算学习交流群 】,和志同道合的朋友们共同打卡学习!



推荐阅读:
真香,朕在看了!
登录查看更多
1

相关内容

阿里云(阿里云-为了无法计算的价值)创立于2009年,是全球领先的云计算及人工智能技术公司,为全球200多个国家和地区的创新创业企业、政府机构等提供服务。

阿里云致力于提供安全、可靠的计算和数据处理能力,让计算成为普惠科技和公共服务,为万物互联的DT世界提供源源不断的新能源。阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算支持不同的互联网应用。目前,阿里云在中国、新加坡、美西、美东等地域设有数据中心。

【ICML2020】对比多视角表示学习
专知会员服务
53+阅读 · 2020年6月28日
【天津大学】知识图谱划分算法研究综述
专知会员服务
110+阅读 · 2020年4月27日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
38+阅读 · 2020年4月26日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
19+阅读 · 2020年1月26日
清华大学张敏老师,个性化推荐的基础与趋势,145页ppt
专知会员服务
87+阅读 · 2019年11月27日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
123+阅读 · 2019年10月10日
阿里巴巴全球化架构设计挑战
InfoQ
35+阅读 · 2019年11月25日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
AI人必看!89页全网最全清华知识图谱报告
人工智能学家
49+阅读 · 2019年2月17日
李善友:战略听着空?但有人用它“绝处逢生”
互联网er的早读课
10+阅读 · 2019年1月15日
一文看尽2018全年计算机视觉大突破
人工智能前沿讲习班
8+阅读 · 2019年1月4日
2019年机器学习:追踪人工智能发展之路
人工智能学家
4+阅读 · 2018年10月14日
基于深度学习的图像目标检测(下)
机器学习研究会
12+阅读 · 2018年1月1日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
9+阅读 · 2020年2月15日
Arxiv
23+阅读 · 2018年10月1日
VIP会员
相关资讯
阿里巴巴全球化架构设计挑战
InfoQ
35+阅读 · 2019年11月25日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
2019中国家政服务行业发展剖析及行业投资机遇分析报告
AI人必看!89页全网最全清华知识图谱报告
人工智能学家
49+阅读 · 2019年2月17日
李善友:战略听着空?但有人用它“绝处逢生”
互联网er的早读课
10+阅读 · 2019年1月15日
一文看尽2018全年计算机视觉大突破
人工智能前沿讲习班
8+阅读 · 2019年1月4日
2019年机器学习:追踪人工智能发展之路
人工智能学家
4+阅读 · 2018年10月14日
基于深度学习的图像目标检测(下)
机器学习研究会
12+阅读 · 2018年1月1日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
Top
微信扫码咨询专知VIP会员