UNREAL(DRL算法) - 专知主题

UNREAL(DRL算法)，无监督强化与辅助学习，是Google DeepMind在A3C算法的改进，在进行特定DRL任务训练过程中，增加了辅助任务，即辅助任务学习，相当于启发性知识，以此来提高强化学习模型的性能。这种辅助任务大致分两种，一种是辅助控制，另一种是辅助反馈。

没有数据了, 换个别的吧!

参考链接

父主题

微信扫码咨询专知VIP会员