深度强化学习论文 - 专知

会员服务 ·

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

A nonlinear real time capable motion cueing algorithm based on deep reinforcement learning

A nonlinear real time capable motion cueing algorithm based on deep reinforcement learning

Arxiv

0+阅读 · 4月3日

Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning

Arxiv

0+阅读 · 4月3日

Efficient Twin Migration in Vehicular Metaverses: Multi-Agent Split Deep Reinforcement Learning with Spatio-Temporal Trajectory Generation

Arxiv

0+阅读 · 3月30日

Multi-Agent Deep Reinforcement Learning for Optimized Multi-UAV Coverage and Power-Efficient UE Connectivity

Arxiv

0+阅读 · 3月31日

On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations

Arxiv

0+阅读 · 3月28日

AllReduce Scheduling with Hierarchical Deep Reinforcement Learning

Arxiv

0+阅读 · 3月26日

Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks

Arxiv

0+阅读 · 3月26日

Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning

Arxiv

0+阅读 · 3月3日

Online Planning for Multi-UAV Pursuit-Evasion in Unknown Environments Using Deep Reinforcement Learning

Arxiv

0+阅读 · 3月5日

Convex Is Back: Solving Belief MDPs With Convexity-Informed Deep Reinforcement Learning

Arxiv

0+阅读 · 3月12日

A Deep Reinforcement Learning Approach to Automated Stock Trading, using xLSTM Networks

Arxiv

0+阅读 · 3月12日

Neuroplastic Expansion in Deep Reinforcement Learning

Arxiv

0+阅读 · 3月13日

Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments

Arxiv

0+阅读 · 3月14日

Mobility-aware Seamless Service Migration and Resource Allocation in Multi-edge IoV Systems

Arxiv

0+阅读 · 3月11日

SafeSlice: Enabling SLA-Compliant O-RAN Slicing via Safe Deep Reinforcement Learning

Arxiv

0+阅读 · 3月17日

参考链接

父主题

微信扫码咨询专知VIP会员