部分可观测马尔可夫决策过程论文 - 专知

会员服务 ·

部分可观测马尔可夫决策过程

部分可观测马尔可夫决策过程

Vectorized Online POMDP Planning

Vectorized Online POMDP Planning

Arxiv

0+阅读 · 10月31日

Coordinated Autonomous Drones for Human-Centered Fire Evacuation in Partially Observable Urban Environments

Arxiv

0+阅读 · 10月27日

Online POMDP Planning with Anytime Deterministic Optimality Guarantees

Arxiv

0+阅读 · 10月27日

ESCORT: Efficient Stein-variational and Sliced Consistency-Optimized Temporal Belief Representation for POMDPs

Arxiv

0+阅读 · 10月24日

Recurrent Natural Policy Gradient for POMDPs

Arxiv

0+阅读 · 10月17日

Hi-Drive: Hierarchical POMDP Planning for Safe Autonomous Driving in Diverse Urban Environments

Arxiv

0+阅读 · 10月15日

Sequential Monte Carlo for Policy Optimization in Continuous POMDPs

Arxiv

0+阅读 · 10月10日

Recurrent Natural Policy Gradient for POMDPs

Arxiv

0+阅读 · 10月9日

Online POMDP Planning with Anytime Deterministic Guarantees

Arxiv

0+阅读 · 3月27日

Risk-aware Integrated Task and Motion Planning for Versatile Snake Robots under Localization Failures

Arxiv

0+阅读 · 2月27日

Tighter Value-Function Approximations for POMDPs

Arxiv

0+阅读 · 2月10日

Influence-Based Reward Modulation for Implicit Communication in Human-Robot Interaction

Arxiv

0+阅读 · 2月20日

Anytime Incremental $ρ$POMDP Planning in Continuous Spaces

Arxiv

0+阅读 · 2月4日

Solving Hierarchical Information-Sharing Dec-POMDPs: An Extensive-Form Game Approach

Arxiv

0+阅读 · 1月2日

Hierarchical Object-Oriented POMDP Planning for Object Rearrangement

Arxiv

0+阅读 · 1月8日

参考链接

微信扫码咨询专知VIP会员