高效探索高维状态空间的能力对于深度强化学习(RL)的实际成功至关重要。本文介绍了一种名为随机潜在探索(Random Latent Exploration,RLE)的新探索技术,该技术结合了奖励加成和噪声加成(两种深度RL中有效探索的流行方法)的优势。RLE利用了通过在环境的某些(随机)状态中向原始任务奖励添加结构化随机奖励来扰动奖励的想法,以鼓励代理在训练过程中探索环境。RLE实现简单,实践效果良好。为了展示RLE的实际有效性,我们在具有挑战性的ATARI和ISAACGYM基准上进行了评估,结果表明RLE在所有任务中表现出的总体得分高于其他方法。