新智元报道
来源:arxiv
编辑:白峰
为什么需要离线强化学习
离线强化学习的难点在哪?
RL Unplugged让离线强化学习成为现实
DM Control Suite,是在MuJoCo中实现的一组控制任务。
DM Locomotion,是涉及类人动物的运动任务。
Atari 2600,街机学习环境(ALE)套件,包含57套Atari 2600游戏(Atari57)。
Real-world Reinforcement Learning Suite,包括高维状态和动作空间,较大的系统延迟,系统约束,多目标,处理非平稳性和部分可观察性等任务。