深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

精品内容

《基于深度强化学习的战场策略》
专知会员服务
23+阅读 · 1月13日
【伯克利博士论文】在大规模语言模型时代构建自主系统
专知会员服务
38+阅读 · 2024年12月28日
【斯坦福博士论文】非平稳环境中的深度强化学习算法
专知会员服务
27+阅读 · 2024年12月9日
深度强化学习中的可塑性损失:综述
专知会员服务
22+阅读 · 2024年11月8日
【教程】通过人类反馈的强化学习,77页ppt
专知会员服务
37+阅读 · 2024年10月5日
【牛津大学博士论文】深度具身智能体的空间推理与规划
深度强化学习在水下目标识别中的应用研究
专知会员服务
23+阅读 · 2024年9月3日
【ICML2024】深度强化学习中的随机潜在探索
专知会员服务
18+阅读 · 2024年7月19日
参考链接
父主题
微信扫码咨询专知VIP会员