强化学习(RL)是一种流行的处理顺序决策任务的范式,其中agent只有有限的环境反馈。尽管在过去的三十年里取得了许多进步,但是在许多领域的学习仍然需要大量的与环境的交互,这在现实的场景中是非常昂贵的。为了解决这个问题,迁移学习被应用于强化学习,这样在一个任务中获得的经验可以在开始学习下一个更困难的任务时得到利用。最近,有几项研究探索了如何将任务(或数据样本本身)排序到课程中,以便学习一个可能很难从头学起的问题。在本文中,我们提出了一个课程学习的强化学习框架,并利用它来调查和分类现有的课程学习方法的假设、能力和目标。最后,我们使用我们的框架来发现开放的问题,并为未来的RL课程学习研究提出方向。