如何让机器人走出实验室,进入充满复杂性的真实世界? 机器人必须解决两个根本问题——(1) 感知:通过不同的感知方式感知世界;(2) 决策:通过推理决策及其后果来在世界中采取行动。机器学习承诺使用数据以可扩展的方式解决这两个问题。然而,在实际的机器人领域中,机器学习的表现却未尽如人意。 本课程深入探讨机器人学习,研究基本算法和面临的挑战,并通过真实案例研究应用,包括自动驾驶和操作控制。我们将学习: * 应对分布偏移、探索/利用问题的模仿学习和互动式无悔学习。 * 结合模型预测控制和无模型方法的实用强化学习。 * 使用概率推理和二维/三维深度学习来构建感知模型。 * 人类反馈学习(RLHF)、基于LLMs的规划、人类运动预测及离线强化学习等前沿技术。