我向实验室成员提供了一份关于强化学习的数学深入教程。这是为了帮助成员学习RL方法并将其应用于各自的问题领域,也为了我自己深入理解RL。演讲从Atari游戏玩智能体的背景下解释学习智能体开始,并解释了典型RL方法和论文中使用的不同成本函数和术语。本演讲旨在使听众对RL有足够的基本概念,以便他们可以立即开始阅读有关RL的最新论文,并能够理解其中的术语。
https://anmolsharma.co/talk/rl-tut/