值迭代论文 - 专知

会员服务 ·

值迭代

Rank-One Modified Value Iteration

Arxiv

0+阅读 · 10月21日

Fitted value iteration methods for bicausal optimal transport

Arxiv

0+阅读 · 10月6日

Value Iteration for Learning Concurrently Executable Robotic Control Tasks

Value Iteration for Learning Concurrently Executable Robotic Control Tasks

Arxiv

0+阅读 · 4月1日

Nonparametric Bellman Mappings for Value Iteration in Distributed Reinforcement Learning

Arxiv

0+阅读 · 3月20日

Reinforcement Learning for Infinite-Horizon Average-Reward Linear MDPs via Approximation by Discounted-Reward MDPs

Arxiv

0+阅读 · 3月11日

Logarithmic Regret of Exploration in Average Reward Markov Decision Processes

Arxiv

0+阅读 · 2月10日

Analysis of Value Iteration Through Absolute Probability Sequences

Arxiv

0+阅读 · 2月5日

Sound Value Iteration for Simple Stochastic Games

Arxiv

0+阅读 · 2024年11月18日

Universal Complexity Bounds Based on Value Iteration for Stochastic Mean Payoff Games and Entropy Games

Arxiv

0+阅读 · 2024年11月11日

Task-oriented Age of Information for Remote Monitoring Systems

Arxiv

0+阅读 · 2024年11月1日

Federated UCBVI: Communication-Efficient Federated Regret Minimization with Heterogeneous Agents

Arxiv

0+阅读 · 2024年10月30日

Markov Potential Game with Final-time Reach-Avoid Objectives

Arxiv

0+阅读 · 2024年10月23日

Reinforcement Learning for Infinite-Horizon Average-Reward Linear MDPs via Approximation by Discounted-Reward MDPs

Arxiv

0+阅读 · 2024年10月22日

Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning

Arxiv

0+阅读 · 2024年10月14日

Pessimistic Nonlinear Least-Squares Value Iteration for Offline Reinforcement Learning

Arxiv

0+阅读 · 2024年10月9日

参考链接

微信扫码咨询专知VIP会员