阿里专有云断电有多复杂?

2017 年 10 月 24 日 大数据和云计算技术 朱洁

下面这个大卡车就是阿里2017在杭州的云栖大会发布的专有云。这个卡车号称最大能力可以处理500万TPS业务。


阿里云副总裁李津在现场演示了阿里云专有云断电,我们从技术上角度来看看实现这个有多复杂(阿里没有公布具体的实现,只能根据作者从业经验推断分析)。

讲技术前,扯点其他的:

首先我觉得这个创意挺不错,虽然有点类似AWS/Google。AWS 在2016 re:invent 就开了一辆卡车到大会主席台,主要是可以帮助客户一次性搬迁EB数据,相当于整个数据中心。阿里不完全一样,是个私有云的概念。类似的数据中心集装箱Google很早也提过。但是现场演示断电还是首创,从参会的媒体的报道来看,还是引起了很多话题。


另外,从中可以看出,阿里已经决心进入私有云和专有云,去拓展大型客户。以前阿里上客户的互联网、创新业务比较多。阿里积累到一定程度之后,进入中大型客户,赚取更高额的利润的决心变大。要做到这一点,当能需要满足中大型客户的诉求,可掌控,够安全,够稳定。

下面回到这次演练来,演练选取一个模拟的比较简单的业务,记录跑步者的各项数据(心跳,速度等等),排名显示在大屏幕上,一共涉及四个服务SLB、RDS、ECS、OSS,演示的内容就是断掉其中的一个柜服务器(从演示来看,一共是6个柜,每个柜8台服务)业务不受影响,来体现灾备能力。


实事求是的说,做一个可靠的专有云还是有不少工作要做的,从硬件到软件都要考虑相应的冗余灾备设计。比如服务器本身要双电源,网络要冗余,上层基础软件要能自动切换,相关告警检测能力都需要有。

不过这次演示的业务比较简单,直接断掉一框服务,考验的主要是服务的业务切换能力。涉及的几个服务SLB、RDS、OSS本身都是有分布式能力,ECS上装应用,应用也比较简单,主要就是个显示展现,可以直接无状态分布。

SLB:负载均衡,负责将业务分发到有处理的能力的服务器;本身一般是主备容灾。

RDS:通过多实例分布式部署,数据库自动同步能力。每个跑步者的数据是相互独立的,一个实例挂了之后,其他实例接管业务。

OSS:对象存储本身都是分布式多份冗余。

ECS:应用无状态分布,数据都存在RDS里面。跑步者的数据出错,进行重传和重连即可。

总的来说,业务很简单,演示的技术也都是成熟技术。

猜你喜欢

 

 

 

《大数据架构详解》第2次修订说明

Docker/K8S再学习

云观察系列:金山云梳理

云观察系列:群雄逐鹿cloud 2.0

京东云初体验

云观察系列:漫谈运营商公有云发展史

云观察系列:百度云的一波三折

云观察系列:阿里云战略观察

超融合方案分析系列(8)SmartX超融合方案分析

超融合方案分析系列(7)思科超融合方案分析


加入星球,获取一对一咨询

 

 

 

我建的知识星球,有星球可以加入。有门槛,66每年,还不够吃顿饭。:)

加入技术讨论群

 

 

 

为了方便大家相互交流学习,创建了一个公众号同名微信群:《大数据和云计算技术交流群》,人数已经900+,欢迎大家加下面我的微信,我拉大家进群,自由交流。


登录查看更多
0

相关内容

李津(LI JIN),现任蚂蚁金服全球技术合作与发展部总经理。毕业于清华大学计算机系人工智能实验室。2014年加入阿里巴巴,是阿里巴巴“喵街”产品技术创始人。加入蚂蚁金服以来先后担任支付宝移动智能技术部总经理,蚂蚁金服人工智能部资深总监。美国微软工作20年,曾担任微软BING首席技术总监,在搜索、推荐、广告、大数据计算等领域都有很深的造诣,是计算机软件行业和互联网行业的持续创新者。
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
267+阅读 · 2020年6月10日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
126+阅读 · 2020年5月22日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
236+阅读 · 2020年5月21日
专知会员服务
32+阅读 · 2020年5月20日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
162+阅读 · 2020年5月14日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
68+阅读 · 2020年3月9日
阿里巴巴全球化架构设计挑战
InfoQ
35+阅读 · 2019年11月25日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
阿里技术专家:优秀工程师是怎样炼成的?
51CTO博客
8+阅读 · 2019年6月15日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
亿级订单数据的访问与储存,怎么实现与优化
ImportNew
11+阅读 · 2019年4月22日
亿级订单数据的访问与存储,怎么实现与优化?
码农翻身
16+阅读 · 2019年4月17日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
Deep Co-Training for Semi-Supervised Image Segmentation
Arxiv
8+阅读 · 2018年5月15日
Arxiv
4+阅读 · 2018年4月29日
Arxiv
17+阅读 · 2018年4月2日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
267+阅读 · 2020年6月10日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
126+阅读 · 2020年5月22日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
236+阅读 · 2020年5月21日
专知会员服务
32+阅读 · 2020年5月20日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
162+阅读 · 2020年5月14日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
68+阅读 · 2020年3月9日
相关资讯
阿里巴巴全球化架构设计挑战
InfoQ
35+阅读 · 2019年11月25日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
阿里技术专家:优秀工程师是怎样炼成的?
51CTO博客
8+阅读 · 2019年6月15日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
亿级订单数据的访问与储存,怎么实现与优化
ImportNew
11+阅读 · 2019年4月22日
亿级订单数据的访问与存储,怎么实现与优化?
码农翻身
16+阅读 · 2019年4月17日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
相关论文
Top
微信扫码咨询专知VIP会员