UNREAL(DRL算法),无监督强化与辅助学习,是Google DeepMind在A3C算法的改进,在进行特定DRL任务训练过程中,增加了辅助任务,即辅助任务学习,相当于启发性知识,以此来提高强化学习模型的性能。这种辅助任务大致分两种,一种是辅助控制,另一种是辅助反馈。
父主题
Top