阿里云服务大规模故障:运维操作失误

2018 年 6 月 28 日 高效开发运维
编辑 | 张婵
昨天下午阿里云出现大范围故障,影响了全国半个互联网圈。运维工作责任太重大。

6 月 27 日下午 4 点 20 分左右,阿里云出现大范围故障,手机端和 PC 端都无法访问,持续时间一个多小时,影响范围包括阿里云官网控制台,以及 MQ,NAS,OSS 等产品功能,也有用户反应阿里巴巴,淘宝,滴滴和石墨文档等产品也出现了服务不稳定的情况,据说金融云也出现故障。阿里云用户众多,此次大规模故障可以说是牵一发而动全身,影响了全国半个互联网了。

到今天凌晨 1 点左右,阿里云官方微博发布了故障说明。说明中表示这次事故是运维操作失误,对于这次故障阿里云没有借口,将认真复盘,“敬畏每一行代码,敬畏每一分依托”。

对这份故障说明很多网友都指出了一个问题,就是虽然阿里云承认了自己的失误,但是对阿里云用户造成的损失并没有提及任何补偿措施,这让有损失的用户心里多少还是有点不爽。

昨天下午故障发生时,大家都在吐槽自己受到了影响,也都在纷纷猜测到底出了什么问题。有传言说是实习生误删登陆服务 (实习生:这个锅我们不背),也有人说是阿里基础设施故障,底层网络出了问题,数据不会丢,只是发生了网络的短时间不可用。

在出现故障大家都慌得不行的时候,硬件供应商,IDC 服务商,其他云服务商都趁乱来给自己打了一波广告。

但是此次出现问题的是业务部分,而不是云服务器出了问题,希望大家下次自家别出问题就好了。

也有很多人对故障的出现表示理解。有网友说,“系统越复杂,越集中,越容易出故障,而且一旦出故障,还会引起雪崩效应,造成的损失就更大。”

资深技术专家陈皓在微博 @左耳朵耗子上也发表了自己的看法:阿里云出故障了,任何技术人员都会知道故障不可避免,对于故障我们应该给予更多的理解。这里,只希望阿里云不要处理工程师,因为惩罚事故责任人完全没有意义。系统的错误往往来自于团队的工程错误,应该改善技术工程手段或软件设计,就算是人没招对,也怪招聘过程,而事故责任人反而是最无辜的……


活动推荐

架构师在关注技术,开发应用的同时,需要定期梳理自己的架构设计思维,积累时间长了,你看待世界事物的方式会发生根本性变化,你会发现我们生活的世界也是在抽象、分层、分治和演化的基础上构建起来的。

ArchSummit 会议邀请了国内外大公司的专家来分享架构思路,包括一些创业公司的研发团队管理经验,会让你有豁然开朗的收获。会议报名最后一周,点击阅读原文。


登录查看更多
0

相关内容

阿里云(阿里云-为了无法计算的价值)创立于2009年,是全球领先的云计算及人工智能技术公司,为全球200多个国家和地区的创新创业企业、政府机构等提供服务。

阿里云致力于提供安全、可靠的计算和数据处理能力,让计算成为普惠科技和公共服务,为万物互联的DT世界提供源源不断的新能源。阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算支持不同的互联网应用。目前,阿里云在中国、新加坡、美西、美东等地域设有数据中心。

商业数据分析,39页ppt
专知会员服务
162+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
资源|Blockchain区块链中文资源阅读列表
专知会员服务
44+阅读 · 2019年11月20日
知识图谱本体结构构建论文合集
专知会员服务
107+阅读 · 2019年10月9日
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
防代码泄漏的监控系统架构与实践
FreeBuf
5+阅读 · 2019年4月30日
深度解析机器学习系统的八大坑
AI100
4+阅读 · 2019年3月2日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
18+阅读 · 2018年12月21日
【机器学习】如何通过机器学习预测维护设备?
产业智能官
16+阅读 · 2018年7月9日
一个人的企业安全建设之路
FreeBuf
5+阅读 · 2017年7月7日
Position-aware Graph Neural Networks
Arxiv
15+阅读 · 2019年6月11日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年3月28日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
162+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
资源|Blockchain区块链中文资源阅读列表
专知会员服务
44+阅读 · 2019年11月20日
知识图谱本体结构构建论文合集
专知会员服务
107+阅读 · 2019年10月9日
相关资讯
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
防代码泄漏的监控系统架构与实践
FreeBuf
5+阅读 · 2019年4月30日
深度解析机器学习系统的八大坑
AI100
4+阅读 · 2019年3月2日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
18+阅读 · 2018年12月21日
【机器学习】如何通过机器学习预测维护设备?
产业智能官
16+阅读 · 2018年7月9日
一个人的企业安全建设之路
FreeBuf
5+阅读 · 2017年7月7日
Top
微信扫码咨询专知VIP会员