潜在博弈中的学习和基于共识的分布式优化是这项工作的重点。对潜在博弈的分析是由博弈论设计激发的,它将多智能体系统中的优化问题转化为模型化的潜在博弈中函数最大化问题。在不同的工程应用中,处理网络系统越来越受欢迎,这支持了人们对基于分布式共识的优化的兴趣。
本书研究了使系统中的多智能体收敛到某种最优状态的算法。这些算法可以根据系统的信息结构进行分类。所考虑的程序的一个共同特点是,它们不要求智能体有记忆来遵循规定的规则。提出了一个适用于具有离散状态和基于预言机信息的无记忆系统的一般学习动力学。提供了一些保证该算法的有效行为的设置。考虑了这种高效的一般学习程序的一个特殊类型,称为Logit动力学。此外,异步和同步Logit动力学被扩展到具有连续行动的博弈情况。也讨论了这种连续状态动力学的收敛保证。此外,还开发了基于通信和收益的算法。它们被证明可以在连续行动潜力博弈建模的系统中学习局部最优。用来研究后一程序收敛特性的随机近似技术也被应用于网络系统中基于分布式共识的优化。在这种情况下,所提出的推和算法的随机性允许系统摆脱次优临界点,并收敛到目标函数的局部最小值,而目标函数不被假定为凸的。