控制动态系统是一个具有广泛应用的基本问题,从机器人技术到生物工程等领域都有涉及。最近,博弈论中的遗憾最小化原始概念被应用于控制领域,为更具挑战性的非随机控制设置提供了新颖的实例最优性能保证。本论文进一步探索了从多智能体视角看控制的好处。具体而言,我们首先提出了一种用于控制器验证的生成干扰的新算法,该算法依赖于在非随机控制游戏中重新定义玩家的角色。接下来,我们提供了非随机控制设置的合作多智能体扩展,涉及从我们的多智能体游戏到单一智能体遗憾最小化的简化。此外,我们展示了通过这种视角,即使在单一智能体设置中,也可以实现对失败的新的鲁棒性概念。虽然控制是一个强大的工具,但它在很大程度上依赖于对动力学的了解。最后几章提供了两种非常不同的方法来实现在没有这种模型的情况下的鲁棒性。第一种方法将非随机控制方法扩展到无模型强化学习。作为另一种方法,我们考虑使用经典控制理论工具的未知系统,这些系统的动力学大致是线性的。
控制理论领域长期以来一直是塑造众多技术和科学进步的关键。其应用范围非常广泛,从库存规划到机器人系统的精确操控。经典控制的本质在于其为本质上易于变化和不确定的动态系统带来可预测性和稳定性的能力。这种能力不仅在传统工程学科中具有基础性作用,而且还在新兴领域中发挥作用,从而不断重新定义通过技术创新可实现的界限。
多年来,控制理论的发展受到了追求最优性和鲁棒性的指导。例如,最优L2控制框架一直是这一旅程的基石,为线性系统提供了一种系统的方法,这些系统由具有二次成本的iid噪声驱动。同样,鲁棒控制范式在确保系统稳定性和面对最坏情况的不确定性和干扰时的性能中发挥了作用。这些工具虽然强大,但并没有完全捕捉到真实世界的复杂性。一方面,这两者对成本都有强烈的结构假设,但或许更重要的是,真实世界既不是良性的,也不是最坏情况的。要解决真实问题,我们需要为中间地带设计的工具。 因此,控制理论的景观正在演变。认识到许多真实世界的系统在非随机或对抗性条件下运行,导致了范式的转变。这一转变开启了新的可能性领域,在这个领域中,特别是遗憾最小化的博弈论概念被用来重新定义控制策略。遗憾最小化是一种评估策略相对于后见之明中最佳可能策略的性能的概念,为控制提供了新的视角。它揭示了实例最优性能的概念,其中的焦点不仅仅是平均性能,而是在特定实例中,特别是在具有挑战性的非随机设置中表现出色。
这篇论文的探索从经典控制和博弈论见解的交汇处开始。它深入探讨了从多智能体视角出发的控制系统的复杂动态,不仅重新想象了控制器和干扰的角色,而且还转变了理解和缓解不确定性的方法。通过整合这些多样化但相互关联的思想线索,这项工作旨在为控制理论领域规划一条新的道路,一条更适合现代系统的复杂性和不确定性的道路。