主题: Model-Based Reinforcement Learning:Theory and Practice
摘要: 强化学习系统可以通过两种方式之一做出决策。在基于模型的方法中,系统使用世界的预测模型来提问“如果我做x会发生什么?”?“选择最好的x1。在另一种无模型方法中,建模步骤被完全忽略,有利于直接学习控制策略。尽管在实践中,这两种技术之间的界限可能变得模糊,但作为一种粗略的指导,它对于划分算法可能性的空间是有用的。
嘉宾简介: Michael Janner,伯克利人工智能研究实验室的一名博士生。