The proliferation of cloud-native architectures, characterized by microservices and dynamic orchestration, has rendered modern IT infrastructures exceedingly complex and volatile. This complexity generates overwhelming volumes of operational data, leading to critical bottlenecks in conventional systems: inefficient information processing, poor task coordination, and loss of contextual continuity during fault diagnosis and remediation. To address these challenges, we propose AOI (AI-Oriented Operations), a novel multi-agent collaborative framework that integrates three specialized agents with an LLM-based Context Compressor. Its core innovations include: (1) a dynamic task scheduling strategy that adaptively prioritizes operations based on real-time system states, and (2) a three-layer memory architecture comprising Working, Episodic, and Semantic layers that optimizes context retention and retrieval. Extensive experiments on both synthetic and real-world benchmarks demonstrate that AOI effectively mitigates information overload, achieving a 72.4% context compression ratio while preserving 92.8% of critical information and significantly enhances operational efficiency, attaining a 94.2% task success rate and reducing the Mean Time to Repair (MTTR) by 34.4% compared to the best baseline. This work presents a paradigm shift towards scalable, adaptive, and context-aware autonomous operations, enabling robust management of next-generation IT infrastructures with minimal human intervention.


翻译:以微服务与动态编排为特征的云原生架构的普及,使得现代IT基础设施变得极其复杂且多变。这种复杂性产生了海量的运维数据,导致传统系统面临关键瓶颈:信息处理效率低下、任务协调能力不足,以及在故障诊断与修复过程中上下文连续性缺失。为应对这些挑战,我们提出了AOI(AI导向运维),一种新颖的多智能体协同框架,它集成了三个专用智能体与一个基于大语言模型的上下文压缩器。其核心创新包括:(1)一种动态任务调度策略,能根据实时系统状态自适应地优化运维任务优先级;(2)一个由工作记忆、情景记忆和语义记忆构成的三层记忆架构,以优化上下文的保留与检索。在合成数据集和真实场景基准上的大量实验表明,AOI有效缓解了信息过载问题,实现了72.4%的上下文压缩率,同时保留了92.8%的关键信息,并显著提升了运维效率,任务成功率达到了94.2%,与最佳基线方法相比,平均修复时间(MTTR)降低了34.4%。这项工作为实现可扩展、自适应且具备上下文感知能力的自主运维提供了范式转变,能够以最少的人工干预实现对下一代IT基础设施的稳健管理。

0
下载
关闭预览

相关内容

误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关资讯
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员