本书提供了分布式优化、博弈和学习的基本理论。它包括那些直接从事优化工作的人,以及许多其他问题,如时变拓扑、通信延迟、等式或不等式约束,以及随机投影。本书适用于在动态经济调度、需求响应管理和智能电网插电式混合动力汽车路由等领域使用分布式优化、博弈和学习理论的研究人员和工程师。
无线技术和计算能力的进步使得理论、模型和工具的发展成为必要,以应对网络上大规模控制和优化问题带来的新挑战。经典的优化方法是在所有问题数据都可用于集中式服务器的前提下工作的。然而,这一前提不适用于由电力系统、传感器网络、智能建筑和智能制造等应用驱动的分布式环境中的大型网络系统。在这样的环境中,每个节点(agent)根据自己的数据(信息)以及通过底层通信网络从相邻的agent接收到的信息进行本地计算,从而分布式地解决大规模控制和优化问题。最终,集中式优化方法必然会走向衰落,从而产生一种新的分布式优化类型,它考虑了多个agent之间的有效协调,即所有agent共同协作,使一个局部目标函数之和的全局函数最小化。
本书研究了近年来分布式优化问题中的几个标准热点问题,如无约束优化、有约束优化、分布式博弈和分布式/分散学习等。为了强调分布式优化在这些主题中的作用,我们将重点放在一个简单的原始(次)梯度方法上,但我们也提供了网络中其他分布式优化方法的概述。介绍了分布式优化框架在电力系统控制中的应用。这本书自然主要包括三个部分。第一部分讨论了分布式优化算法理论,共分为四章:(1)多智能体时滞网络中的协同分布式优化;(2)时变拓扑多智能体系统的约束一致性;(3)不等式约束和随机投影下的分布式优化;(4)随机矩阵有向图上的加速分布优化。第二部分作为过渡,研究了分布式优化算法理论及其在智能电网动态经济调度问题中的应用,包括两章:(5)时变有向图约束优化的线性收敛性;(6)时变有向图上经济调度的随机梯度推动。第三部分对分布式优化、博弈和学习算法理论进行了分析和综合,本部分所有算法都是针对智能电网系统内的特定案例场景设计的。本部分共分三章:(7)智能微电网能源交易博弈中的强化学习;(8)不完全信息约束博弈的强化学习;(9)基于拥塞博弈的插电式混合动力汽车路径选择强化学习。其中,给出了仿真结果和实际应用实例,以说明前面提出的优化算法、博弈算法和学习算法的有效性和实用性。