成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
深度强化学习
关注
153
深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
综合
百科
VIP
热门
动态
论文
精华
AllReduce Scheduling with Hierarchical Deep Reinforcement Learning
Arxiv
0+阅读 · 3月26日
Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks
Arxiv
0+阅读 · 3月26日
Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning
Arxiv
0+阅读 · 3月3日
Online Planning for Multi-UAV Pursuit-Evasion in Unknown Environments Using Deep Reinforcement Learning
Arxiv
0+阅读 · 3月5日
Convex Is Back: Solving Belief MDPs With Convexity-Informed Deep Reinforcement Learning
Arxiv
0+阅读 · 3月12日
A Deep Reinforcement Learning Approach to Automated Stock Trading, using xLSTM Networks
Arxiv
0+阅读 · 3月12日
Neuroplastic Expansion in Deep Reinforcement Learning
Arxiv
0+阅读 · 3月13日
Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments
Arxiv
0+阅读 · 3月14日
Mobility-aware Seamless Service Migration and Resource Allocation in Multi-edge IoV Systems
Arxiv
0+阅读 · 3月11日
SafeSlice: Enabling SLA-Compliant O-RAN Slicing via Safe Deep Reinforcement Learning
Arxiv
0+阅读 · 3月17日
EmoBipedNav: Emotion-aware Social Navigation for Bipedal Robots with Deep Reinforcement Learning
Arxiv
0+阅读 · 3月16日
Navigating Demand Uncertainty in Container Shipping: Deep Reinforcement Learning for Enabling Adaptive and Feasible Master Stowage Planning
Arxiv
0+阅读 · 3月20日
Deep Reinforcement Learning for Dynamic Resource Allocation in Wireless Networks
Arxiv
0+阅读 · 3月13日
Deep Reinforcement Learning for Dynamic Resource Allocation in Wireless Networks
Arxiv
0+阅读 · 2月28日
Timing the Match: A Deep Reinforcement Learning Approach for Ride-Hailing and Ride-Pooling Services
Arxiv
0+阅读 · 3月17日
参考链接
父主题
强化学习
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top