Azure 宕机 3 个小时:因人为配置 DNS 失误

2019 年 5 月 3 日 云头条

可以用TITSUP这个技术术语来形容今天持续了三个小时的宕机,TITSUP的全称是完全无法支持用户的数据包。

 

至少在过去的一两个小时,由于DNS配置失误,微软Azure云在全球范围内处于不稳定的状态。


这次影响整个平台的故障破坏了全球各地由微软托管的各种系统:从Azure SQL数据库和App Services,到多因子身份验证、Microsoft 365、Teams、Dynamics、SharePoint Online和OneDrive,不一而足。


本文发稿时,这个云巨头在逐渐恢复如初,Azure地区在逐个地恢复正常,不过你遇到的实际情况可能会有所不同。问题似乎是从协调世界时(UTC)19点45分左右开始的。


Azure状态页面在UTC 21点28分显示:“客户在Azure及微软其他服务(包括M365、Dynamics和DevOps等)方面可能遇到间歇性连接问题。”


“工程师正在研究影响网络连接的DNS解析问题。连接问题导致对计算、存储和数据库等下游服务带来了影响,一些客户可能无法提交支持请求。”


“一有更多信息,我们会及时发布。一些客户可能开始看到恢复正常。”


换句话说,微软还没有给出故障消除信号;正如微软所说,在接下来的半小时任何情况都有可能发生。


早些时候的Azure状态页面


在Microsoft 365状态页面上,微软的技术人员声称内部DNS配置错误导致了这次宕机:


用户可能无法访问Microsoft 365服务或功能。


更多信息:受影响的服务包括SharePoint Online、OneDrive for Business、Microsoft Teams、Stream、Power BI、Planner、Forms、PowerApps、Dynamics 365、Intune和Office Licensing。


我们已找到并纠正了阻止用户访问Microsoft 365服务和功能的DNS配置问题。我们观察到成功的连接数量增加,我们的遥测数据表明所有服务正在恢复。我们继续密切关注环境,以验证服务已恢复。



这不会是DNS问题头一回整垮Azure――据估计,上一次发生这种情况时,几个客户的数据库丢失数据,所以自求多福吧。


最新消息:


微软表示它已修复了破损的系统,结束了今天持续了三个小时的宕机,Azure的网络基础设施应该或多或少已恢复正常:“我们已采取了缓解措施;大多数服务已恢复,只有一小部分服务可能仍受到一些影响。”


这个科技巨头补充道:“底层的根本原因是不正确的名称服务器授权问题。”


相关阅读:

VMware 将其虚拟化软件引入到 Azure:具有里程碑意义的举措

Azure 故障 17 个小时:重启了下,好了。。。

Azure的多因子验证搞砸了:用户被锁在了外面、已持续 6 个小时

Azure 9.4 “尸检报告”:雷击后又遭遇连环杀

Azure 挂了:云被雷击垮了;已持续 22 个小时

用户吐槽 Azure Kubernetes ,因其搞砸了集群 !

唉!微软删除了客户数据库:5 分钟的交易数据消失得无影无踪


登录查看更多
0

相关内容

Windows Azure是微软基于云计算的操作系统,现在更名为“Microsoft Azure”,和Azure Services Platform一样,是微软“软件和服务”技术的名称。Windows Azure的主要目标是为开发者提供一个平台,帮助开发可运行在云服务器、数据中心、Web和PC上的应用程序。云计算的开发者能使用微软全球数据中心的储存、计算能力和网络基础服务。Azure服务平台包括了以下主要组件:Windows Azure;Microsoft SQL数据库服务,Microsoft .Net服务;用于分享、储存和同步文件的Live服务;针对商业的Microsoft SharePoint和Microsoft Dynamics CRM服务。
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
67+阅读 · 2020年3月9日
MIT公开课-Vivienne Sze教授《深度学习硬件加速器》,86页ppt
【新书】Java企业微服务,Enterprise Java Microservices,272页pdf
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
Ceph的正确玩法之SSD作为HDD的缓存池
炼数成金订阅号
5+阅读 · 2019年2月14日
React Native 分包哪家强?看这文就够了!
程序人生
13+阅读 · 2019年1月16日
Gartner「首份」云管理平台(CMP)魔力象限
云头条
7+阅读 · 2019年1月14日
孙正义:未来30年的人工智能和物联网
智能交通技术
3+阅读 · 2018年3月4日
【AI说】揭秘京东实时数据仓库背后的神秘力量—JDQ
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关资讯
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
Ceph的正确玩法之SSD作为HDD的缓存池
炼数成金订阅号
5+阅读 · 2019年2月14日
React Native 分包哪家强?看这文就够了!
程序人生
13+阅读 · 2019年1月16日
Gartner「首份」云管理平台(CMP)魔力象限
云头条
7+阅读 · 2019年1月14日
孙正义:未来30年的人工智能和物联网
智能交通技术
3+阅读 · 2018年3月4日
【AI说】揭秘京东实时数据仓库背后的神秘力量—JDQ
相关论文
Top
微信扫码咨询专知VIP会员