在强化学习(RL)中使用先验知识已经变得无处不在,因为我们正在开发适合真实机器人的系统。最近的研究显示,人们对以行为先验的形式吸收先验知识的方法重新产生了兴趣。行为先验是指当处于特定状态时,可以为代理提出潜在有意义的行为的系统,包括经典手工制作的控制器、之前学习的策略、演示和最近潜在的技能模块。这些系统已经在RL中证明了其在加速训练、更安全探索和广泛任务推广方面的有效性。
本次研讨会的目标是将不同领域的研究人员聚集在一起,包括RL,机器人和控制,讨论行为先验可能在RL中发挥的作用。这包括我们可以学习/建模这些先验的各种方法,在RL框架内集成他们的经验的方法,以及他们的适用性来解决现实机器人中RL面临的一些关键挑战。