深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

精品内容

基于深度强化学习的海上编队防空任务分配
专知会员服务
40+阅读 · 8月14日
面向深度强化学习的对抗攻防综述
专知会员服务
37+阅读 · 8月2日
基于深度强化学习算法的无人机智能规避决策
专知会员服务
40+阅读 · 6月27日
深度强化学习的无人作战飞机空战机动决策
专知会员服务
56+阅读 · 5月22日
基于内在动机的深度强化学习探索方法综述
专知会员服务
31+阅读 · 5月13日
基于多智能体深度强化学习的体系任务分配方法
参考链接
父主题
微信扫码咨询专知VIP会员