机器学习的进步推动了从装配线到自动驾驶的现实世界机器人的部署。学习如何让机器人做出更好的决策是一系列独特的挑战。机器人必须是安全的,通过与环境的互动在线学习,并预测人类伙伴的意图。这门研究生水平的课程深入探讨了机器人学习和决策的各种范例。我们看看:
- 交互式无遗憾学习作为处理分布转移、对冲、探索/利用的基本框架。
- 从各种互动模式(演示、干预)中获得的模仿学习作为一个统一的博弈论框架。
- 利用模型预测控制和无模型方法的实用强化学习。
- 开放的挑战,如安全,因果混淆和线下学习。 本课程侧重于算法,从现实世界的机器人经验教训,并具有强大的编程组件
讲者: