Azure Core 是微软的核心基础设施团队,负责管理百万台机器,为用户提供计算能力与资源。现在,资源管理与优化团队和微服务管理平台团队将在北京建立全新的子团队,与美国团队共同完成新的任务和挑战。
> 当某个用户需要1台虚拟机的时候,如何从上百万台物理机中选择一台机器来部署这台虚拟机?
> 当用户需要100台虚拟机的时候,如何从上百万台机器中选择应该用哪些机器部署这些虚拟机?
> 当成百上千的用户都需要计算资源时,又该如何从百万台机器中高效合理的选择计算资源分配给用户?
这些都是云计算中需要解决的问题,高效的分配资源可以让有限的资源服务更多的用户,资源管理与优化团队在过去的几年中通过数据分析,建立模型,机器学习,不断的提高Azure的资源利用率。
> 在数据中心的上百万机器上都运行着提供不同功能的微服务。如何在上百万台机器上更新微服务?
> 如果新的微服务有bug,如何检测,避免这个bug扩散到所有机器上?
> 如何更新百万台机器上的Driver/Firmware/kernel?
> 在微服务更新的过程中,如何降低对用户的影响?
> 对于一台全新的机器,如何将对应的微服务一一启动起来,如何避免冲突 ?
这些都是微服务管理平台团队正在解决和不断优化的问题。稳定性和可靠性是用户选择云提供商的一个重要考量因素,微服务管理平台对云服务的稳定性和可靠性起了至关重要的作用。