智能体与人类或机器人的无缝交互很困难,因为现实环境是动态变化的,并根据自智能体的行为更新策略,而自智能体必须预测这些变化以随机应变。受人类行为启发,我们认识到机器人不需要显式地为另一个智能体要进行的每一个低级动作建模;相反,我们可以通过高级表征来捕捉其他智能体的潜在策略。我们提出了一个基于强化学习的学习框架来学习一个智能体策略的潜在表示,其中自智能体识别其行为与另一个智能体的未来策略之间的关系。然后,自智能体利用这些潜在的动力来影响另一个智能体,有目的地引导他们走向共同适应的策略。在多个模拟领域和一个真实的空中曲棍球游戏中,本文的方法要优于其他方法,并学会了影响其他智能体。