Kubernetes provides native autoscaling mechanisms, including the Horizontal Pod Autoscaler, Vertical Pod Autoscaler, and node-level autoscalers, to enable elastic resource management for cloud-native applications. However, production environments frequently experience Service Level Objective violations and cost inefficiencies due to reactive scaling behavior, limited use of application-level signals, and opaque control logic. This paper investigates how Kubernetes autoscaling can be enhanced using AIOps principles to jointly satisfy SLO and cost constraints under diverse workload patterns without compromising safety or operational transparency. We present a gap-driven analysis of existing autoscaling approaches and propose a safe and explainable multi-signal autoscaling framework that integrates SLO-aware and cost-conscious control with lightweight demand forecasting. Experimental evaluation using representative microservice and event-driven workloads shows that the proposed approach reduces SLO violation duration by up to 31 percent, improves scaling response time by 24 percent, and lowers infrastructure cost by 18 percent compared to default and tuned Kubernetes autoscaling baselines, while maintaining stable and auditable control behavior. These results demonstrate that AIOps-driven, SLO-first autoscaling can significantly improve the reliability, efficiency, and operational trustworthiness of Kubernetes-based cloud platforms.


翻译:Kubernetes提供了包括水平Pod自动扩缩容器、垂直Pod自动缩容器以及节点级自动扩缩容机制在内的原生自动扩缩容功能,以实现云原生应用的弹性资源管理。然而,由于反应式扩缩容行为、应用级信号的有限使用以及不透明的控制逻辑,生产环境经常面临服务等级目标违规与成本效率低下的问题。本文研究了如何利用AIOps原则增强Kubernetes自动扩缩容能力,从而在多样化工作负载模式下同时满足SLO与成本约束,且不损害安全性或操作透明度。我们通过对现有自动扩缩容方法进行差距驱动分析,提出了一种安全且可解释的多信号自动扩缩容框架,该框架将SLO感知与成本敏感的控制机制与轻量级需求预测相结合。基于典型微服务与事件驱动工作负载的实验评估表明:相较于默认及调优后的Kubernetes自动扩缩容基线方法,所提方案能将SLO违规时长减少最高31%,将扩缩容响应时间提升24%,并将基础设施成本降低18%,同时保持稳定且可审计的控制行为。这些结果证明,AIOps驱动的SLO优先自动扩缩容策略能够显著提升基于Kubernetes的云平台的可靠性、效率与操作可信度。

0
下载
关闭预览

相关内容

Kubernetes 是一个自动化部署,扩展,以及容器化管理应用程序的开源系统。
Python图像处理,366页pdf,Image Operators Image Processing in Python
基于Prometheus的K8S监控在小米的落地
DBAplus社群
16+阅读 · 2019年7月23日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员