成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
深度强化学习
关注
153
深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
综合
百科
VIP
热门
动态
论文
精华
Joint Optimization of UAV-Carried IRS for Urban Low Altitude mmWave Communications with Deep Reinforcement Learning
Arxiv
0+阅读 · 1月6日
Securing Integrated Sensing and Communication Against a Mobile Adversary: A Stackelberg Game with Deep Reinforcement Learning
Arxiv
0+阅读 · 1月4日
Adaptive Context-Aware Multi-Path Transmission Control for VR/AR Content: A Deep Reinforcement Learning Approach
Arxiv
0+阅读 · 2024年12月27日
Advanced Persistent Threats (APT) Attribution Using Deep Reinforcement Learning
Arxiv
0+阅读 · 1月7日
A Competition Winning Deep Reinforcement Learning Agent in microRTS
Arxiv
0+阅读 · 1月2日
Real-Time Integrated Dispatching and Idle Fleet Steering with Deep Reinforcement Learning for A Meal Delivery Platform
Arxiv
0+阅读 · 1月10日
Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach
Arxiv
0+阅读 · 1月2日
Deep Reinforcement Learning for Job Scheduling and Resource Management in Cloud Computing: An Algorithm-Level Review
Arxiv
0+阅读 · 1月2日
BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems
Arxiv
0+阅读 · 1月3日
Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning
Arxiv
0+阅读 · 1月11日
Application of Deep Reinforcement Learning to UAV Swarming for Ground Surveillance
Arxiv
0+阅读 · 1月15日
Autonomous Navigation of 4WIS4WID Agricultural Field Mobile Robot using Deep Reinforcement Learning
Arxiv
0+阅读 · 2024年12月25日
A novel multi-agent dynamic portfolio optimization learning system based on hierarchical deep reinforcement learning
Arxiv
0+阅读 · 1月12日
Co-Activation Graph Analysis of Safety-Verified and Explainable Deep Reinforcement Learning Policies
Arxiv
0+阅读 · 1月6日
Improving DeFi Accessibility through Efficient Liquidity Provisioning with Deep Reinforcement Learning
Arxiv
0+阅读 · 1月13日
参考链接
父主题
强化学习
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top