成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
UNREAL(DRL算法)
关注
18
UNREAL(DRL算法),无监督强化与辅助学习,是Google DeepMind在A3C算法的改进,在进行特定DRL任务训练过程中,增加了辅助任务,即辅助任务学习,相当于启发性知识,以此来提高强化学习模型的性能。这种辅助任务大致分两种,一种是辅助控制,另一种是辅助反馈。
综合
百科
VIP
热门
动态
论文
精华
精品内容
没有数据了, 换个别的吧!
参考链接
父主题
强化学习
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top