强化学习作为一类重要的人工智能方法, 广泛应用于解决复杂的控制与决策问题, 其在众多领域的应用已展示出 巨大潜力. 近年来, 强化学习从单智能体决策逐渐扩展到多智能体协作与博弈, 形成多智能体强化学习这一研究热点. 多智 能体系统由多个具有自主感知和决策能力的实体组成, 有望解决传统单智能体方法难以应对的大规模复杂问题. 多智能体 强化学习不仅需要考虑环境的动态性, 还需应对其他智能体策略的不确定性, 这增加了学习和决策的复杂度. 本文梳理多智 能体强化学习在控制与决策领域的研究, 分析其面临的主要问题与挑战, 从控制理论与自主决策两个层次综述现有的研究 成果与进展, 并针对未来的研究方向进行了展望. 通过本文的分析, 期望为未来多智能体强化学习的研究提供有价值的参考 和启示. 关键词 强化学习, 多智能体系统, 序列决策, 协同控制, 博弈论