微软亚洲研究院的秦涛主管研究员做了“从单智能体学习到多智能体学习:GAN,对偶学习等”的报告,从协同式多智能体学习、竞争式多智能体学习、协同和竞争共存式多智能体学习三方面,阐述了微软亚洲研究院关于多智能体学习的最新研究,讨论了对偶学习如何提高学习效率,包括从未标记数据中学习(双向无监督学习)、从已标记数据中学习(双向监督学习)和推理(双向推理),并介绍了对抗神经机器翻译的相关工作。
来源:自动化学报